基于位置语言模型的中文信息检索系统的研究

首页 > 成果 > 详情

认领

导出

Link by 中国知网学术期刊 Link by 万方学术期刊

反馈

作者信息关键词期刊信息基础信息归属信息摘要

成果类型：

期刊论文

作者：

陈雅兰;胡小华;涂新辉;何婷婷（何婷婷）

作者机构：

华中师范大学计算机学院武汉430079

德雷塞尔大学信息科学与技术学院费城19082

语种：

中文

关键词：

位置语言模型;近邻性;段落检索;传播数

关键词(英文)：

Proximity;Passage retrieval;Propagated count

期刊：

计算机科学

ISSN：

1002-137X

年：

2015

卷：

期：

页码：

265-269

DOI：

10.11896/j.issn.1002-137X.2015.7.057

基金类别：

国家社会科学基金重大项目（12＆2D223）湖北省自然科学基金重点项目（2011CDA034）国家语委“十二五”重点项目（ZDI125-1）国家“十二五”科技支撑计划课题（2012BAK24B01）教育部/国家外国专家局高等学校学科创新引智计划项目（B07042）华中师范大学中央高校基本科研业务费项目（CCNU13A05014,CCNU13C01001,CCNU13F010）国家自然科学基金（61300144）资助

机构署名：

本校为第一机构

院系归属：

计算机学院

摘要：

在大多数现有的检索模型中常常忽略了如下事实:一个文档中匹配到的查询词项的近邻性和打分时所基于的段落检索也可以被用来促进文档的打分。受此启发,提出了基于位置语言模型的中文信息检索系统,首先通过定义位置传播数的概念,为每个位置单独地建立语言模型;然后通过引入KL-divergence检索模型,并结合位置语言模型给每个位置单独打分;最后由多参数打分策略得到文档的最终得分。实验中还重点比较了基于词表和基于二元两种中文索引方法在位置语言模型中的检索效果。在标准NTCIR5、NTCIR6测试集上的实验结果表明,该检索方法在两种索引方式上都显著改善了中文检索系统的性能,并且优于向量空间模型、...

摘要(英文)：

In most existing retrieval models,the facts are often overlooked that the proximity of matched query terms in a document and passage retrieval used to score can also be exploited to promote scoring for documents.Inspired by this,a Chinese information retrieval system based on the positional language model was proposed.Firstly,we defined the concept of propagated count to establish a positional language model for each position.Then through combing KL-divergence retrieval model and positional language model,we scored for each individual position.Finally,we scored the document by the multi-parame...

反馈

产权有误：本人成果被他人认领

数据有误：数据基本信息有误

归属有误：成果的院系归属、机构署名归属有误

其他原因：

验证码：

看不清楚，换一个

确定

取消

成果认领

标题：

用户	作者	通讯作者	--
	请选择	请选择	--

确定

取消

基于位置语言模型的中文信息检索系统的研究

反馈

成果认领

提示

该栏目需要登录且有访问权限才可以访问