版权说明 操作指南
首页 > 成果 > 详情

利用标点符号自动识别分句

认领
导出
Link by 中国知网学术期刊 Link by 维普学术期刊 Link by 万方学术期刊
反馈
分享
QQ微信 微博
成果类型:
期刊论文
作者:
李琼
作者机构:
华中师范大学,国际文化交流学院,湖北,武汉,430079
[李琼] 华中师范大学
语种:
中文
关键词:
标点符号;断句标记;自动识别;分句;非分句
关键词(英文):
punctuation;punctuation mark;automatic identification;clause;non-clause
期刊:
皖西学院学报
ISSN:
1009-9735
年:
2011
卷:
27
期:
1
页码:
108-110
基金类别:
教育部人文社会科学研究青年基金项目“汉语复句书读前后语言片段的非分句识别”(09YJC740032);
机构署名:
本校为第一机构
院系归属:
国际文化交流学院
摘要:
为了建设一个面向中文信息处理的大规模复句"精加工"语料库,首先要完成自动分词和词性标注工作,在此基础上进行分句层次和关系的自动划分和标注。由于标点符号是最直观而明晰的断句标记,我们编制的初始程序让计算机一"碰到"标点符号就把它前后的语言片段都判定为分句。这就为今后基于句法和语义知识的非分句识别奠定了良好的基础。
摘要(英文):
In order to build an "advanced" compound-sentence corpus for Chinese Information Process,automatic word segmentation and POS tagging work should be completed first of all.Then on this basis,automatic classification and labeling of levels and relationship between clauses should be conducted.As punctuation marks are the most intuitive and clear marks,we programmed the computer to regard the language fragments between punctuation as clauses.Doing so much is risking,because it will "victimize" a lot of non-clause language fragments...

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com