版权说明 操作指南
首页 > 成果 > 详情

基于贝叶斯模型的复句关系词自动识别与规则挖掘

认领
导出
Link by 中国知网学术期刊
反馈
分享
QQ微信 微博
成果类型:
期刊论文
作者:
杨进才(杨进才);郭凯凯;沈显君;胡金柱
作者机构:
[杨进才; 郭凯凯; 沈显君; 胡金柱] 华中师范大学计算机学院
语种:
中文
关键词:
复句关系词;贝叶斯;规则;自动标识
关键词(英文):
Bayesian;Rules;Automatic identification
期刊:
计算机科学
ISSN:
1002-137X
年:
2015
卷:
42
期:
7
页码:
291-294+319
基金类别:
教育部社科基金(13YJAZH117) 国家社科基金(14BYY093)资助
机构署名:
本校为第一机构
院系归属:
计算机学院
摘要:
复句是汉语语法的重要实体单位,关系词的自动识别是复句标识的基础,对复句的标识以及篇章的研究有重要意义。在对汉语复句语料库进行广泛分析的基础上,从复句关系词所在的环境和关系词的组合搭配方面进行特征的提取,对提取的特征进行形式化描述。采用互信息和信息增益相结合的方式进行特征选择以及冗余特征的消除;使用贝叶斯模型对特征集合进行训练和测试;将基于统计过程的结果转化为规则,形成规则库,并根据规则进行关系词自动识别。实验结果显示,本方法获得了较高的识别正确率,具有可行性和有效性。
摘要(英文):
The compound sentence is an important unit of the Chinese sentence and its annotation is important to the research on comprehending Chinese texts.Identification of relation words is the basis of compound sentence annotation.Based on a comprehensive analysis of Chinese compounds corpus,this paper extracted features of relation words from their context and collocation.Those features are described in formulas.A combination of mutual information with information gains is used for selecting features and eliminating redundant features.The Bayesian model is used for training and testing feature sets....

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com