版权说明 操作指南
首页 > 成果 > 详情

基于Lucene的地名数据库快速检索系统

认领
导出
Link by 中国知网学术期刊 Link by 万方学术期刊
反馈
分享
QQ微信 微博
成果类型:
期刊论文
论文标题(英文):
Place name database quick searching system based on Lucene
作者:
张文元;周世宇;谈国新(谈国新
作者机构:
[谈国新; 张文元; 周世宇] 华中师范大学国家文化产业研究中心, 武汉, 430079
语种:
中文
关键词:
地名;全文检索;数据库;中文分词;相关度排序
关键词(英文):
Lucene
期刊:
计算机应用研究
ISSN:
1001-3695
年:
2017
卷:
34
期:
6
页码:
1756-1761
基金类别:
国家科技支撑计划资助项目(2012BAH83F00);
机构署名:
本校为第一机构
院系归属:
国家文化产业研究中心
摘要:
针对传统关系型数据库海量地名数据检索效率低下的问题,提出了一种盘古分词和Lucene全文检索相结合的地名数据库快速检索方法。首先,设计了一种地名数据表结构,比较了几种常用开源分词器的中文分词性能,并选用性能优异的盘古中文分词器,通过扩展其词典来实现中文地名的有效分词。其次,利用内存索引和多线程并行处理技术提高Lucene创建倒排索引效率,并依据地名类别和显示优先级属性优化了检索结果相关度排序策略。最后,开发了一套具有快速搜索和地图定位展示的Web地名检索系统,使用500万条真实地名数据测试了其检索性能,查询平均耗时不到1 s,比MySQL数据库模糊检索效率提高了15倍,匹配结果也更加...
摘要(英文):
To avoid the low efficiency in massive place names searching in the traditional relational database, this paper proposed a fast place name database retrieval method with the integration of PanGuAnalyzer and Lucene full-text search toolbox. Firstly, it designed a place name data structure, and compared the segmentation performances of several open source Chinese analyzers. Based on the results, it integrated the excellent PanguAnalyzer with a rich place dictionary into Lucene so as to improve the effect of Chinese place name segmentation. To improve the efficiency of creating inverted index, it...

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com