“句管控”理论在分词和标注中的应用
作者:
沈威
期刊:
语言研究,2010年30(1):69-74 ISSN:1000-1263
作者机构:
华中师范大学,语言与语言教育研究中心,武汉,430079;[沈威] 华中师范大学
关键词:
句管控;中文信息处理;分词与标注
摘要:
"小句中枢说"认为,句法机制管控着整个语法面貌的大局,小句在中枢地位上对汉语语法规则的方方面面发挥着管束控制作用[1].我们认为,"句管控"理论不仅在汉语本体研究中有着核心地位,在中文信息处理领域中同样起着统领全局的作用.本文着重从"句管控"理论的角度探讨了中文信息处理中的分词与标注问题.
语种:
中文
展开
理论的改善和事实的支撑——关于领属性偏正结构充当远宾语
期刊:
汉语学报,2008年(3):2-11 ISSN:1672-9501
作者机构:
华中师范大学语言与语言教育研究中心,430079;[邢福义; 沈威] 华中师范大学
关键词:
双宾语;远宾语;偏正结构;领属性;理论;事实
摘要:
有学者认为双宾结构里的远宾语排斥领属性偏正结构,本文认为这一结论未能全面反映语言运用的客观事实.领属性偏正结构可以充当远宾语的现象,尽管频率不太高,但从古代到现当代都有使用,而且当前在某个范围内还相当活跃.在远宾语位置上有时使用领属性偏正结构,具有特定的不可取代的语用价值.本文主要包括四个部分:1)反例的问难;2)判断的分寸;3)句式的变换和语用的需求;4)古汉语用法.末尾有个结束语.本文的主旨在于说明:任何理论,都不会一开始就十分完善.理论的改善,需要事实的支撑.
语种:
中文
展开
关联词的搭配研究
作者:
姚双云;沈威
期刊:
计算机与现代化,2007年(4):7-9 ISSN:1006-2475
作者机构:
华中师范大学语言与语言教育研究中心,湖北,武汉,430079;华中师范大学计算机科学系,湖北,武汉,430079;[姚双云; 沈威] 华中师范大学
关键词:
关联词;搭配强度;离散度;句法分析
摘要:
探讨了关联词的搭配距离、搭配强度和搭配的离散度,针对汉语复句特点,将搭配距离限定为18个词以内,在此基础上设计了关联词搭配强度的评估方法.利用1500万词的"《人民日报》语料"为样本,计算了190组常见格式的搭配强度.结果表明,该方法是有效的,符合汉语复句的实际情况.
语种:
中文
展开
基于规则的复句中的关系词标注探讨
作者:
沈威;姚双云
期刊:
福建电脑,2007年(4):6-7 ISSN:1673-2782
作者机构:
华中师范大学,计算机科学系,湖北,武汉,430079;华中师范大学,语言与语言教育研究中心,湖北,武汉,430079;[姚双云; 沈威] 华中师范大学
关键词:
基于规则;复句;关系词;标注
摘要:
汉语中关系词的自动标注问题是自然语言理解领域的基础性研究课题。由于它的研究结果直接影响到以后的层次关系的标注、机器翻译等诸多领域的研究,加上这一问题本身具有的难度,使其很难从根本上解决。因此,也一直收到人们的普遍关注。关系词的自动标注就是通过采用适当的方法对关系词进行标注。
语种:
中文
展开
基于复句语料库分词系统研究
作者:
杜超华;胡金柱;沈威;姚双云
期刊:
计算机与数字工程,2007年35(5):43-44+81+206 ISSN:1672-9722
作者机构:
华中师范大学计算机科学系,武汉,430079;华中师范大学语言与语言教育研究中心,武汉,430079;[姚双云; 胡金柱; 杜超华; 沈威] 华中师范大学
关键词:
汉语复句语料库;关系词;分词
摘要:
复句在书面语中具有举足轻重的地位,如何让计算机正确理解复句是中文信息处理中一个值得重视的问题。现有的分词系统对复句关系词的正确切分与标注上不足以满足对复句进行层次分析和语义分析的需要。建立的分词系统在复句中关系词的切分和标注上做出了必要的改进。
语种:
中文
展开
基于渡越矩阵的复句关系词自动标注初探
作者:
胡金柱;沈威;杜超华;姚双云;罗进军
期刊:
微计算机信息,2007年23(30):200-202 ISSN:1008-0570
作者机构:
[胡金柱; 沈威; 杜超华] 华中师范大学计算机科学系;[姚双云; 罗进军] 华中师范大学语富教育研究中心
关键词:
复旬;关系词;渡越矩阵
摘要:
复句关系词的自动标注是自然语言理解领域的基础性研究课题,是层次关系标注和机器翻译等问题的研究基础。本文采用概率统计方法,建立相应的渡越矩阵研究复句关系词的自动标注方法,并进行了有效标注。标注后。对复句关系词中容易产生歧义的“结果”和“如”进行了封闭性测试和开放性测试,其准确率分别达到98.32%和96.41%,85%和83%。
语种:
中文
展开
基于复句语料库的分词系统的研究
作者:
杜超华;沈威;姚双云
作者机构:
[杜超华; 沈威; 姚双云] 华中师范大学计算机科学系;[杜超华; 沈威; 姚双云] 华中师范大学语言与语言教育研究中心
会议名称:
第三届学术计算语言学研讨会
会议时间:
2006-08-15
会议地点:
沈阳
会议论文集名称:
第三届学生计算语言学研讨会论文集
关键词:
汉语复句语料库;关系词;分词
摘要:
复句在书面语中具有举足轻重的地位,如何让计算机正确理解复句是中文信息处理中一个值得重视的问题。现有的分词系统对复句关系词的正确切分与标注上不足以满足对复句进行层次分析和语义分析的需要。本文建立的分词系统在复句中关系词的切分和标注上做出了必要的改进。
语种:
中文
展开