基于可比语料库的双语词典抽取方法比较研究

首页 > 成果 > 详情

认领

导出

Link by 中国知网学术期刊 Link by 万方学术期刊

反馈

作者信息关键词期刊信息基础信息归属信息摘要

成果类型：

期刊论文

作者：

李舰;李波;陈鹏;杨丹

作者机构：

华中师范大学计算机学院, 武汉, 430079

中国电力科学研究院, 武汉, 430074

[李舰; 李波; 陈鹏] 华中师范大学计算机学院, 武汉, 430079

[杨丹] 中国电力科学研究院, 武汉, 430074

语种：

中文

关键词：

可比语料库;双语词典抽取;上下文向量;词向量

关键词(英文)：

bilingual lexicon extraction;context vector;distributed representation

期刊：

小型微型计算机系统

ISSN：

1000-1220

年：

2017

卷：

期：

页码：

1554-1561

基金类别：

61300144:国家自然科学基金 YB125-132:国家语委科研项目 CCNU15A05062:中央高校基本科研业务费专项 CCNU16A06015:中央高校基本科研业务费专项

机构署名：

本校为第一机构

院系归属：

计算机学院

摘要：

双语词典是一种重要的语言资源,但现有的基于可比语料库的双语词典抽取方法在体系结构、所依赖的基础性资源等方面差异较大,这使得在统一的实验条件下对各种算法进行比较变得很困难.因此,目前的研究工作多选择将性能评测任务限定在很狭小的范围内,缺乏统一的评测结果给双语词典抽取任务的发展和算法的选择带来一定困难.为解决上述问题,选取并实现了四种代表性的双语词典抽取方案,在统一的测试数据集上进行比较研究.在比较研究中,我们重点揭示了词典抽取任务中几种关键因素如语料库大小、训练词典大小等对各算法性能的不同影响程度.本文的结论对今后相关工作中的实验设计、性能比较与算法选用都具...

摘要(英文)：

The bilingual lexicon is an important language resource.Current methods of lexicon extraction from comparable corpora differ in architecture and basic resources they rely on,which makes it difficult to make comparisons among various algorithms.Therefore,existing research work has performed the evaluation in a narrow range.The lack of unified evaluation results brings certain difficulty to the development of bilingual lexicon extraction task and the choosing of algorithms.To resolve above problems,this paper has chosen and implemented four representative methods of bilingual lexicon extraction,...

反馈

产权有误：本人成果被他人认领

数据有误：数据基本信息有误

归属有误：成果的院系归属、机构署名归属有误

其他原因：

验证码：

看不清楚，换一个

确定

取消

成果认领

标题：

用户	作者	通讯作者	--
	请选择	请选择	--

确定

取消

基于可比语料库的双语词典抽取方法比较研究

反馈

成果认领

提示

该栏目需要登录且有访问权限才可以访问