版权说明 操作指南
首页 > 成果 > 详情

一个基于词语搭配的英文文本检索软件的实现

认领
导出
Link by 中国知网学术期刊 Link by 万方学术期刊
反馈
分享
QQ微信 微博
成果类型:
期刊论文
作者:
乔艳梅;杨进才(杨进才);刘应亮
作者机构:
[乔艳梅] 青岛城市管理职业学校
华中师范大学计算机学院
武汉理工大学外语学院
[杨进才] 华中师范大学
[刘应亮] 武汉理工大学
语种:
中文
关键词:
文本检索;词语搭配;通配符匹配;确定有限自动机;搭配力计算
期刊:
计算机应用与软件
ISSN:
1000-386X
年:
2017
卷:
34
期:
10
页码:
85-90+142
基金类别:
国家社会科学基金项目(14BYY093) 国家自然科学基金项目(31371275)
机构署名:
本校为其他机构
院系归属:
计算机学院
摘要:
词语搭配是英语语言学研究中的一个重要课题,近年来,趋向于注重数据验证和量化研究。探讨一个基于搭配研究的英文文本检索软件ColloStu实现的关键技术。该软件设计一个通配符匹配算法,该算法使用确定有限自动机DFA,通过压缩自动机的状态数,加快匹配速度。同时,在检索搭配词时能识别共现语境中的句子终结符,从而更有效地检索出搭配词。对搭配力计算的Z分值算法进行了改进,综合运用Z分值、T分值、MI值从多个角度计算搭配强度,使计算更加准确。实验表明,与主流的检索软件相比,Collo Stu除增加了搭配力计算功能外,单词统计和搭配词检索更准确。
摘要(英文):
Word collocation is an important subject in the study of English linguistics. In recent years,it tends to focus on data validation and quantitative research. This paper discusses the key technology of Collo Stu,an English text retrieval software based on collocation research. The software designs a wildcard matching algorithm that uses the DFA to speed up the matching speed by compressing the number of its states. It can identify the sentence terminator in the cooccurrence context in order to retrieve the collocations more effectively. We have improved the Z score algorithm of collocation calc...

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com