版权说明 操作指南
首页 > 成果 > 详情

基于词词关联矩阵改进的模糊检索研究(二)——叙词表控制下词间关联度的改进算法

认领
导出
Link by 中国知网学术期刊 Link by 万方学术期刊
反馈
分享
QQ微信 微博
成果类型:
期刊论文
作者:
夏立新(夏立新);程秀峰;叶光辉(叶光辉
作者机构:
[夏立新; 叶光辉; 程秀峰] 华中师范大学信息管理系
语种:
中文
关键词:
词间关联度;改进算法;集合分析;语词关系网;叙词表
期刊:
情报学报
ISSN:
1000-0135
年:
2013
卷:
32
期:
3
页码:
270-280
基金类别:
国家社会科学基金重点项目(11AZD090)
机构署名:
本校为第一机构
摘要:
传统上,检索系统利用基于词语共现分析所生成的自构造词表,即词词关联矩阵来实现模糊检索,这种方式生成的词表存在词间关系单一、语词假相关、词义控制差等问题.本文结合传统叙词表,对自构造词表的词间关联度算法进行了改进,新算法丰富了词间关系类型.实证分析表明,新算法有助于提升系统的检索效率.本文首先阐明词间关联度现有算法及关系数据处理方式,并指出现有算法存在的问题,然后引入叙词表控制机制,针对四种词间关系控制情形提出了各自的词间关联度改进算法.最后通过集合从理论上分析改进算法和现有算法,并借助语词关系网实证改进算法对语词关系网的关联性的影响.
摘要(英文):
Traditionally, the fuzzy retrieval model use co-occurrence matrix to automatically generate source thesaurus, the co-occurrence matrix is also named "keyword connection matrix" , but there are some problems using this method, such as single concept relations, pseudo-correlation, badly control of word sense etc. By using the traditional thesaurus function, this article improves the existing algorithm on term-term relative value that riches the types of concept relations. It also been testified that it is helpful to improve retrieval efficiency...

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com