版权说明 操作指南
首页 > 成果 > 详情

一种基于TextRank和卷积神经网络的小学作文自动分类方法

认领
导出
反馈
分享
QQ微信 微博
成果类型:
专利
发明/设计人:
朱晓亮;刘三女牙(刘三女牙);孙建文(孙建文);石昀东
申请/专利权人:
华中师范大学
专利类型:
发明专利
语种:
中文
申请时间:
2018-06-26
申请/专利号:
CN201810671815.0
公开时间:
2018-12-21
公开号:
CN109062958A
主申请人地址:
430079 湖北省武汉市武昌区珞瑜路152号
申请地区:
湖北
机构署名:
本校为第一完成单位
主权项:
1.一种基于TextRank和卷积神经网络的小学作文自动分类方法,其特征在于该方法包括以下步骤:(1)分析小学作文常见的写人、叙事、写景、状物、读后感五类作文的特征,并以此为标准对数据集进行划分;(2)使用基于TextRank的关键句提取模型为各类作文提取关键句来去除多余的语义信息并将其作为数据集;(3)在卷积神经网络的第一层,随机初始化数据集中每个字的wordembedding,将每条数据中的字映射到其对应的wordembedding组成二维特征矩阵作为卷积神经网络的输入;(4)在卷积神经网络的第二层,使用一维卷积核与输入文本的特征矩阵进行卷积运算,得到的结果经过非线性变换并加上偏置向后,最终生成和卷积核数量一致的文本的多层局部卷积特征图;(5)在卷积神经网络第三层,使用max‑pooling算法对多层局部卷积特征图进行采样,得到文本的局部最优特征图;(6)在卷积神经网络的全连接层,将文本的局部最优特征图赋予全连接层,经过全连接层的计算后结果会赋予分类器,用于对文本的类型进行预测并输出最终的分类结果。
摘要:
本发明属于教育信息化领域,提供一种基于TextRank和卷积神经网络的小学作文自动分类方法,该方法首先使用基于TextRank的关键句提取模型为各类作文提取关键句来去除多余的语义信息,然后使用卷积神经网络提取定长的文本特征向量,用于训练分类器,并用于文本类别的预测。本发明方法事先使用TextRank算法对数据集进行了冗余信息的剔除,较其他深度学习方法减少了长文本的干扰信息;本发明方法特征选取自动完成,较传统机器学习方法提高了效率。

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com