版权说明 操作指南
首页 > 成果 > 详情

文本分类中CTM 模型的优化和可视化应用研究

认领
导出
Link by 中国知网学术期刊 Link by 万方学术期刊
反馈
分享
QQ微信 微博
成果类型:
期刊论文
作者:
马长林;杨正良;谢罗迪
作者机构:
[马长林; 杨正良; 谢罗迪] 华中师范大学计算机学院, 湖北, 武汉, 430079
语种:
中文
关键词:
文本分类;CTM 模型;特征提取
关键词(英文):
CTM model;feature selection
期刊:
计算机工程与科学
ISSN:
1007-130X
年:
2017
卷:
39
期:
3
页码:
599-604
基金类别:
国家自然科学基金
机构署名:
本校为第一机构
院系归属:
计算机学院
摘要:
如何从海量文本中自动提取相关信息已成为巨大的技术挑战,文本分类作为解决该问题的重要方法已引起广大关注,而其中文本表示是影响分类效果的关键因素。为此采用相关主题模型进行文本表示,以保证信息完整同时表现主题相关性;基于该模型,对主题数目和特征提取实施了优化处理,综合复杂度和对数似然函数来确定最优主题数目,引入基于互信息的主成分分析算法进行最优特征提取,降低数据维度和特征冗余,使用R语言进行可视化实验分析。
摘要(英文):
How to automatically extract related information from enormous texts has become a huge challenge. As an efficient way to solve this problem, text classification has attracted much attention, in which text representation is a critical factor to affect classification results. The correlated topic model can implement text representation, which can correctly reflect the correlation between topics under the case to remain the integrity of information. Based on this model, we optimize feature selection and the number of topics, and determine the number of topics with perplexity and log-likelihood fu...

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com