版权说明 操作指南
首页 > 成果 > 详情

基于词向量与可比语料库的双语词典提取研究

认领
导出
Link by 中国知网学术期刊 Link by 万方学术期刊
反馈
分享
QQ微信 微博
成果类型:
期刊论文
论文标题(英文):
Bilingual lexicon extraction based on word vector and comparable corpus
作者:
柳路芳;李波;陈鹏;周凌寒;王兵
作者机构:
华中师范大学计算机学院, 湖北, 武汉, 430079
北京吉威时代软件股份有限公司, 北京, 100043
[柳路芳; 李波; 陈鹏; 周凌寒] 华中师范大学计算机学院, 湖北, 武汉, 430079
[王兵] 北京吉威时代软件股份有限公司, 北京, 100043
语种:
中文
关键词:
双语词典;词向量;词间关系;可比语料库
期刊:
计算机工程与科学
ISSN:
1007-130X
年:
2018
卷:
40
期:
2
页码:
368-373
基金类别:
YB125-132:国家语委规划项目(十二五) CCNU15A05062:中央高校基本科研业务费专项 CCNU17GF0005:中央高校基本科研业务费专项 CCNU16A06015:中央高校基本科研业务费专项
机构署名:
本校为第一机构
院系归属:
计算机学院
摘要:
双语词典是跨语言信息检索以及机器翻译等自然语言处理应用中的一项重要资源。现有的基于可比语料库的双语词典提取算法不够成熟,抽取效果有待提高,而且大多数研究都集中在特定领域的专业术语抽取。针对此不足,提出了一种基于词向量与可比语料库的双语词典提取算法。首先给出了该算法的基本假设以及相关的研究方法,然后阐述了基于词向量利用词间关系矩阵从可比语料库中提取双语词典的具体步骤,最后将该抽取方法与经典的向量空间模型做对比,通过实验分析了上下文窗口大小、种子词典大小、词频等因素对两种模型抽取效果的影响。实验表明,与基于向量空间模型的方法相比,本算法的抽取效果有着明显的...
摘要(英文):
Bilingual lexicon is an important resource in natural language processing applications such as cross-language information retrieval and machine translation.The existing bilingual lexicon extraction algorithm based on comparable corpus is not mature enough and its extraction effect needs to be improved,and most researches focus on the extraction of professional terms in specific fields.In view of this shortcoming,this paper proposes a bilingual lexicon extraction algorithm based on word vector and comparable corpus.Firstly,the basic assumptions of the algorithm and the related research methods ...

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com