版权说明 操作指南
首页 > 成果 > 详情

一种中文真词错误检测与修复方法

认领
导出
Link by 中国知网学术期刊 Link by 万方学术期刊
反馈
分享
QQ微信 微博
成果类型:
期刊论文
论文标题(英文):
A Chinese Real-word Error Detection and Repairing Method
作者:
叶俊民;徐松;罗达雄;王志锋;陈曙
作者机构:
华中师范大学计算机学院,武汉,430070
华中师范大学教育信息技术学院,武汉,430070
[陈曙; 叶俊民; 王志锋; 徐松; 罗达雄] 华中师范大学
语种:
中文
关键词:
真词错误;混淆词集;n-gram概率统计模型;上下文语境;中文固定搭配
关键词(英文):
confusion word set;n-gram probability statistical model;context;Chinese fixed collocation
期刊:
计算机工程
ISSN:
1000-3428
年:
2019
卷:
45
期:
8
页码:
178-183
基金类别:
国家社会科学基金(17BTQ061)。
机构署名:
本校为第一机构
院系归属:
计算机学院
教育信息技术学院
摘要:
在线学习社区中的中文真词错误会给中文文本语义的理解带来困难,从而影响基于在线学习社区文本的学习分析效果。为此,提出一种针对在线学习社区短文本的真词错误检测与修复方法。构建混淆词集和混淆词对应的固定搭配知识库,基于n-gram概率统计模型、上下文语境模型和固定搭配知识库,分别计算每一个混淆词的n-gram得分、上下文语境得分和固定搭配得分,对其加权求和作为判断原文是否出错的依据,并将最高得分的混淆词作为修复意见。实验结果表明,该方法召回率、准确率与修复率分别为85.6%、86.3%、92.9%,能准确有效检测与修复学习社区中的中文真词错误。
摘要(英文):
The Chinese real-word error in the online learning community will make it difficult to understand the semantics of Chinese texts,which affects the learning and analyzing effects based on online learning community texts. To this end,this paper proposes a real-word error detection and repairing method for short texts in online learning communities. Firstly,the confusion word set and the fixed collocation knowledge base corresponding to the confusion word are automatically constructed. Then,n-gram scores,context scores and fixed match scores are calculated for each confusion word based on the n-g...

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com