版权说明 操作指南
首页 > 成果 > 详情

一种DF—LDA的文本相似度计算方法

认领
导出
Link by 维普学术期刊 Link by 万方学术期刊
反馈
分享
QQ微信 微博
成果类型:
期刊论文
作者:
陈利;张超;李琼
作者机构:
汉口学院计算机科学与技术学院,湖北武汉
华中师范大学计算机学院,湖北武汉
[张超] 华中师范大学
[陈利; 李琼] 汉口学院
语种:
中文
关键词:
特征选择;LDA模型;DF-LDA方法;降维;文本相似度计算
期刊:
汉口学院学报
年:
2014
卷:
7
期:
4
页码:
1-3
机构署名:
本校为其他机构
院系归属:
计算机学院
摘要:
首先用DF方法对文本进行特征选择,然后使用LDA建模的方法获取文本主题分布;用降维后的文本主题分布计算文本相似度。这种DF和LDA结合的文本相似度计算方法,在考虑到词频信息特征的同时,也考虑了语义信息特征。两次降维不仅降低了算法时间复杂度,而且在文本相似度计算过程中消除了低价值词项的干扰,提高了计算的精度。实验结果表明,DF-LDA算法在Tancrop数据集上F值较LDA方法有了7%的提高。

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com