版权说明 操作指南
首页 > 成果 > 详情

基于可比语料库的双语词典抽取方法比较研究

认领
导出
Link by 中国知网学术期刊 Link by 万方学术期刊
反馈
分享
QQ微信 微博
成果类型:
期刊论文
作者:
李舰;李波;陈鹏;杨丹
作者机构:
华中师范大学计算机学院, 武汉, 430079
中国电力科学研究院, 武汉, 430074
[李舰; 李波; 陈鹏] 华中师范大学计算机学院, 武汉, 430079
[杨丹] 中国电力科学研究院, 武汉, 430074
语种:
中文
关键词:
可比语料库;双语词典抽取;上下文向量;词向量
关键词(英文):
bilingual lexicon extraction;context vector;distributed representation
期刊:
小型微型计算机系统
ISSN:
1000-1220
年:
2017
卷:
38
期:
7
页码:
1554-1561
基金类别:
61300144:国家自然科学基金 YB125-132:国家语委科研项目 CCNU15A05062:中央高校基本科研业务费专项 CCNU16A06015:中央高校基本科研业务费专项
机构署名:
本校为第一机构
院系归属:
计算机学院
摘要:
双语词典是一种重要的语言资源,但现有的基于可比语料库的双语词典抽取方法在体系结构、所依赖的基础性资源等方面差异较大,这使得在统一的实验条件下对各种算法进行比较变得很困难.因此,目前的研究工作多选择将性能评测任务限定在很狭小的范围内,缺乏统一的评测结果给双语词典抽取任务的发展和算法的选择带来一定困难.为解决上述问题,选取并实现了四种代表性的双语词典抽取方案,在统一的测试数据集上进行比较研究.在比较研究中,我们重点揭示了词典抽取任务中几种关键因素如语料库大小、训练词典大小等对各算法性能的不同影响程度.本文的结论对今后相关工作中的实验设计、性能比较与算法选用都具...
摘要(英文):
The bilingual lexicon is an important language resource.Current methods of lexicon extraction from comparable corpora differ in architecture and basic resources they rely on,which makes it difficult to make comparisons among various algorithms.Therefore,existing research work has performed the evaluation in a narrow range.The lack of unified evaluation results brings certain difficulty to the development of bilingual lexicon extraction task and the choosing of algorithms.To resolve above problems,this paper has chosen and implemented four representative methods of bilingual lexicon extraction,...

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com