基于LDA模型的统计学热门主题挖掘及知识图谱分析
作者:
肖明;商慧语;肖毅;廖莉莉
期刊:
华中师范大学学报(自然科学版) ,2022年56(5):781-788,802 ISSN:1000-1190
作者机构:
[肖明] 华中师范大学信息化办公室,武汉430079;[肖明] 华中师范大学语言与语言教育研究中心,武汉430079;[商慧语] 中原银行数智金融创新实验室,郑州450046;华中师范大学信息管理学院,武汉430079;[肖毅; 廖莉莉] 华中师范大学
关键词:
LDA主题模型;知识图谱;共现分析;2-模网络;3-模网络
摘要:
为揭示并对比统计学领域CSSCI期刊创办至今的刊文发展趋势与热门主题,该研究收集从1985-2020年CNKI数据库收录的统计学CSSCI期刊41 495篇文献作为研究对象,运用LDA主题模型及共现网络模型对热门主题及主流研究方法等指标进行热门主题与知识图谱分析,并绘制相关知识图谱.研究表明,近5年来在研究方法上大量采用结构方程模型和分位数回归法,而大数据则成为近年来新增的高频词.LDA模型能够较为精确地挖掘统计学领域的热门主题和研究方法,为科研人员和决策者开展前沿科学活动提供重要支持.
语种:
中文
展开
结合注意力机制与图卷积网络的汉语复句关系识别
作者:
郑浩;李源;沈威;陈佳杰
期刊:
中文信息学报 ,2022年36(11):60-67 ISSN:1003-0077
作者机构:
[郑浩; 陈佳杰; 李源] 华中师范大学计算机学院;[沈威] 华中师范大学语言与语言教育研究中心
关键词:
关系识别;图卷积神经网络;注意力机制
摘要:
复句的关系识别是为了区分句子语义关系的类别,是自然语言处理(NLP)中必不可少的基础研究任务。现有研究无法使机器在表层判别缺少显式句间连接词句子的语义关系类型。该文将Attention机制与图卷积神经网络(GCN)相结合应用到汉语复句语义关系识别中,通过BERT预训练模型获取单句词向量,输入到Bi-LSTM获取句子位置表示,经Attention机制得到各位置间权重构建图网络以捕获句子间的语义信息,通过图卷积抽取深层的关联信息。该文的方法对缺少显式句间连接词句子的关系识别达到了较好的识别效果,为进一步研究计算机自动分析、识别处理复句的基本方法奠定基础。实验结果表明,在汉语复句语料库(CCCS)和汉语篇章树库(CDTB)数据集上,与先前最好的模型相比,其准确率分别为77.3%和75.7%,提升约1.6%,宏平均F1值分别为76.2%和74.4%,提升约2.1%,说明了该文方法的有效性。
语种:
中文
展开
基于句内注意力机制多路CNN的汉语复句关系识别方法
作者:
孙凯丽;邓沌华;李源;李妙;李洋
期刊:
中文信息学报 ,2020年34(6):9-17,26 ISSN:1003-0077
作者机构:
华中师范大学 计算机学院,湖北 武汉 430079;华中师范大学 语言与语言教育研究中心,湖北 武汉 430079;[李妙; 孙凯丽; 李源; 李洋; 邓沌华] 华中师范大学
关键词:
关系识别;非充盈态汉语复句;双向长短期记忆网络(Bi-LSTM);句内注意力机制;卷积神经网络
摘要:
复句的关系识别是对分句间语义关系的甄别,是复句语义分析的关键,旨在从文本中识别句间的关系类型.非充盈态汉语复句存在隐式关系的特点给语义关系识别造成了困难.为了深度挖掘复句中隐含的语义信息,正确地实现关系分类,该文提出了一种基于句内注意力机制的多路CNN网络结构Inatt-MCNN.其中句内注意力机制模型是基于Bi-LSTM的,使其能够学习到句子的双向语义特征以及分句间的关联特征.同时,为了充分利用文本特征,联合使用卷积神经网络(CNN)对复句表示再次建模获得句子局部特征.与其他基于汉语复句语料库(CCCS)和清华汉语树库(TCT)的实验结果相比,该文方法的宏平均F 1值为85.61%,提升约6.08%,平均召回率为84.87%,提升约3.05%.
语种:
中文
展开
基于语义与规则的有标复句层次体系研究
作者:
李源;刁胜权;胡金柱;翟宏森;杨梦川;...
期刊:
计算机工程与科学 ,2017年39(12):2306-2313 ISSN:1007-130X
作者机构:
[李源; 刁胜权; 胡金柱; 翟宏森; 杨梦川; 黄文灿] 华中师范大学计算机学院, 湖北, 武汉, 430079
关键词:
汉语复句;层次关系;语义;挖掘;规则;移进-规约
摘要:
汉语复句层次关系分析是中文信息处理领域极具挑战性的课题之一。为解决关系词标识信息不充足所导致的复句层次关系识别准确率下降问题,挖掘了影响分句关联的形式化语义知识,在此基础上构建了小句关联体识别算法并将其应用于相应的复句层次判定规则之中,以辅助分析其层次关系;对于其余单、多重有标复句的层次识别,使用基于搭配规则的移进-归约算法;最后提出了一种语义与规则相结合的复句层次分析模型。实验结果表明,此方法在一定程度上提高了复句层次关系识别的准确率。
语种:
中文
展开
复句关系词自动识别中规则的表示方法研究
作者:
胡金柱;舒江波;胡泉;李源;杨进才
( 杨进才 ) ;...
期刊:
计算机工程与应用 ,2016年52(1):127-132 ISSN:1002-8331
作者机构:
华中师范大学计算机学院语言研究所, 武汉, 430079;华中师范大学, 国家数字化学习工程技术研究中心, 武汉, 430079;华中师范大学物理科学与技术学院, 武汉, 430079;湖北工业大学计算机学院, 武汉, 430068;[杨进才; 胡金柱; 李源] 华中师范大学计算机学院语言研究所, 武汉, 430079
关键词:
汉语复句关系词;规则的表示方法;自动识别;中文信息处理
摘要:
关系词在现代汉语复句领域起着重要的作用,是汉语语法、语义研究中的重要内容,复句关系词的计算机自动识别是一个非常困难的研究课题。在汉语复句关系词自动识别中规则的约束条件研究的基础上,重点研究现代汉语复句关系词自动识别系统中规则的表示方法,为进一步研究、建设复句关系词自动识别中的规则库,深入研究规则与统计相结合自动识别复句和复句关系词的方法,为实现汉语句子和篇章的自动识别奠定基础。
语种:
中文
展开
重组肝素酶I热失活动力学模型的建立与应用
作者:
程咏梅;陈潮梁;陈敬华;刘卫超;周斌;...
期刊:
工业微生物 ,2014年44(2):46-51 ISSN:1001-6678
作者机构:
江南大学药学院;[宋志新] 常山生化药业(江苏)有限公司;[程咏梅; 陈潮梁; 陈敬华; 刘卫超; 周斌] 江南大学
关键词:
肝素酶I;热稳定性;酶失活;动力学;数学模型
摘要:
对组氨酸标签肝素酶I(His-Hep I, EC 4.2.2.7)的热失活机制进行了研究。针对短暂低温处理可以使热失活His-Hep I酶活部分恢复及添加二硫苏糖醇(DTT)使其热稳定性提高的现象,利用荧光探针法研究了失活过程His-Hep I构象变化,证明了该酶构象存在可逆转变行为。为进一步明晰His-Hep I的热失活机制,假设该酶热失活的主要途径包括去折叠及形成聚集体,并以此为基础建立模型进行拟合,模型与实验值吻合良好,表明假设的合理性。根据模型计算的活化能为E_r=100.217 kJ/mol、E_(ir)=7.857 kJ/mol和E_d=77.062 kJ/mol,此数据从一定程度上解释了冷处理为何能使His-Hep I部分恢复活性。进一步研究表明,任何能够抑制这两种途径发生的措施对于提高His-Hep I热稳定性都是有效的。
语种:
中文
展开
篇章连贯语义关系的自动标注方法
作者:
姚双云;胡金柱;舒江波;沈威
期刊:
计算机工程 ,2012年38(7):131-133 ISSN:1000-3428
作者机构:
华中师范大学语言与语言教育研究中心,武汉,430079;华中师范大学国家数字化学习工程技术研究中心,武汉,430079
关键词:
篇章连贯;语义关系;搭配距离;搭配强度;句法规则;自动标注
摘要:
为实现篇章连贯语义关系的判定与自动标注,提出一种综合运用关联词多种语法信息的自动标注方法。该方法利用关联词的词性分布规则排除非关联词,标注出潜在关联词,对比关联词库中的模式表,并综合利用搭配距离、搭配强度和句法位置获取合法的篇章连贯模式,在此基础上标注出其语义关系。通过实验验证了该方法的有效性。
语种:
中文
展开
关联词搭配的自动发现
作者:
姚双云;胡金柱;肖升;沈威
期刊:
计算机应用研究 ,2011年28(12):4426-4428,4432 ISSN:1001-3695
作者机构:
[姚双云; 胡金柱; 沈威] 华中师范大学语言与语言教育研究中心;[肖升] 湖南省第一师范学院信息科学与工程系
关键词:
语料库;关联词;搭配;自动发现
摘要:
提出了关联词搭配模式自动发现的基本方法。建立一个大规模语料库,然后作分词处理,并对关联词进行自动标注和人工校对;评估关联词搭配的三个重要参数(搭配距离、搭配强度MI值、搭配强度Z值),并设定阈值,超过阈值的格式自动作为候选搭配模式。通过实验,标注的准确率为88.75%,表明本方法具有较好效果。运用该方法,发现了以往大量未被注意的句法搭配模式,对研制高质量的关联词知识库起到了积极的促进作用,对复句句法、语义的自动分析具有重要的意义。
语种:
中文
展开
多重复句关系标记搭配的求解模型研究
作者:
胡金柱;雷利利;杨进才
( 杨进才 ) ;舒江波;陈江曼
期刊:
计算机工程与科学 ,2011年33(11):177-182 ISSN:1007-130X
作者机构:
[杨进才; 胡金柱; 雷利利; 陈江曼] 华中师范大学计算机科学系;[舒江波] 华中师范大学
关键词:
多重复句;关系词搭配;解空间树
摘要:
关系词是多重复句的连接成分,其功能是关联分句且标志分句间的语义关系,它对多重复句的研究具有重要意义。但是,在研究基于规则的现代汉语复句关系词的自动标识过程中,发现多重复句内初次识别出的关系标记,较多是伪关系词。这就需要判定其是否是真正的关系词,而判定的基础是确定关系标记之间的搭配关系,这是一个难点。为解决该问题,本文提出了两个算法:(1)利用解空间树得到关系标记所有的搭配集合;(2)对解空间树进行剪枝,去掉无用搭配集。实验测试可知:这两个算法不仅通用性强,而且判定正确率达到98.9%,剩下的1.1%还可以得到近似解,这表明本文提出的算法在处理多重复句问题上具有较好的可行性。
语种:
中文
展开
基于VML的复句关系层次树的可视化研究
作者:
胡金柱;舒江波;周星
期刊:
计算机应用研究 ,2010年27(1):127-130 ISSN:1001-3695
作者机构:
[胡金柱; 舒江波] 华中师范大学语言与语言教育研究中心;[周星] 华中师范大学计算机科学系
关键词:
矢量可标记语言;复句;关系层次树;可视化
摘要:
在现代汉语复句教学和研究中,为了分析复句的逻辑语义关系,经常需要绘制复句关系层次结构图.传统的做法是利用手工方式绘制,以图片的形式存储,但这种方式具有存储容量大、绘制工作量大的缺点.采用VML技术,在标注复句的基础上,研究了复句关系层次树的自动生成方法以及复句关系层次树在网页中的可视化.通过对不同类型复句进行试验,结果表明各种类型的复句均能准确显示.这就表明该可视化方法能够有效地应用到复句信息工程的研究中.
语种:
中文
展开
基于VML的句法树的可视化研究
作者:
杨建红;舒江波
期刊:
河南大学学报(自然科学版) ,2010年40(6):637-641 ISSN:1003-4978
作者机构:
[杨建红] 武汉工业学院计算机与信息工程系;[舒江波] 华中师范大学语言与语言教育研究中心;华中师范大学计算机科学系
关键词:
句法树;可视化
摘要:
在现代汉语教学和研究中,为了分析句子成分之间的关系,经常需要绘制句法结构图.手工方式绘制具有工作量大,存储容量大等缺陷.针对该问题研究了采用VML技术进行句法结构树自动生成以及句法结构树在网页中可视化的方法.与北大树库中的树图进行比较的结果表明提出的图形元素定位方法更精确.
语种:
中文
展开
搭配关系的P/T网建模
作者:
肖升;胡金柱;姚双云;吴锋文
期刊:
中南林业科技大学学报 ,2009年29(1):101-105 ISSN:1673-923X
作者机构:
[肖升; 胡金柱; 姚双云; 吴锋文] 华中师范大学,语言与语言教育研究中心,计算机科学系
关键词:
P/T网;搭配关系;建模;分解
摘要:
首先基于P/T网建立了关系词的基本模型,并通过引入搭配能力函数建立了搭配关系模型;随后,在单重复句的基础上讨论了搭配型的单层分解(合成),在多重复句的基础上讨论了搭配型的多层分解(合成),得到了具有一定应用价值的3个定理.
语种:
中文
展开
面向中文信息处理的复句关系词提取算法研究
作者:
胡金柱;舒江波;姚双云;周星;吴锋文;...
期刊:
计算机工程与科学 ,2009年31(10):90-93 ISSN:1007-130X
作者机构:
[胡金柱; 舒江波; 姚双云; 吴锋文; 肖升] 华中师范大学语言与语言教育研究中心;[周星] 华中师范大学计算机科学系
会议名称:
2009年全国理论计算机科学学术年会
会议时间:
2009-08-07
会议地点:
哈尔滨
会议论文集名称:
2009年全国理论计算机科学学术年会论文集
关键词:
复句;关系词提取;正向选择算法;关系词搭配理论
摘要:
关系词语对于标明复句关系有重要的作用.在用计算机来实现汉语多重关系复句的关系层次分析的过程中,关系词语的提取和标引是首要的任务.本文针对利用计算机处理汉语复句的研究需求,结合词性标记和关系词搭配理论,提出了一种关系词提取算法--正向选择算法.通过测试可知,关系词提取的正确率达到89.88%,这表明了算法的有效性以及用于利用计算机处理汉语复句的可行性.
语种:
中文
展开
基于规则库和聚类分析的复句短语字段的自动识别研究
作者:
胡金柱;俞小娟;李琼;周毕吉
期刊:
华中师范大学学报(自然科学版) ,2008年42(2):190-194 ISSN:1000-1190
作者机构:
华中师范大学,计算机科学系,武汉,430079;华中师范大学,语言教育研究中心,武汉,430079;[周毕吉; 胡金柱; 李琼; 俞小娟] 华中师范大学
关键词:
短语字段;规则库;聚类分析;变量
摘要:
复句层次结构与层次关系研究,是一项将中文信息处理由字、词处理阶段提升到句处理阶段的关键性难题.在研究复句层次划分和层次关系之前,首先要确定复句中分句的数量,需要排除其中非完整分句的字段(本文中称之为短语字段).结合语言学的相关理论,首先建立规则库,在此基础上,引入聚类分析法,对短语字段进行分类,最终使短语字段的自动识别率达到92.1%.
语种:
中文
展开
面向智能搜索引擎的本体学习研究
作者:
肖明;胡金柱;肖毅
期刊:
计算机应用研究 ,2008年25(8):2362-2365 ISSN:1001-3695
作者机构:
[肖明; 胡金柱] 华中师范大学语言与语言教育研究中心;华中师范大学计算机科学系;[肖毅] 华中师范大学信息管理系
关键词:
智能搜索引擎;本体;本体学习
摘要:
智能搜索引擎是解决当前网络信息检索中存在诸多瓶颈问题的有效途径。智能搜索引擎需要获取、预处理、表示和集成不同层次的(如HTML/XML/RDF/OWL文档)的数据和信息,并最终转换成各领域的智能语义信息。领域本体是实行智能的关键。提出了一种实现从Web文档中(半)自动构建本体的学习系统框架,并讨论本体学习中概念的获取、相互关系的获取等关键问题.
语种:
中文
展开
基于节点流量的低能耗无线传感器网络MAC协议
作者:
廖先林;耿娜;赵林亮;王光兴
期刊:
东北大学学报(自然科学版) ,2007年28(10):1458-1461 ISSN:1005-3026
通讯作者:
Liao, X.-L.
作者机构:
[赵林亮; 廖先林; 王光兴; 耿娜] School of Information Science and Engineering, Northeastern University, Shenyang 110004, China
通讯机构:
School of Information Science and Engineering, Northeastern University, China
关键词:
无线传感器网络;MAC协议;S-MAC协议;低能耗;TBEE-MAC协议
摘要:
根据传感器节点的生存时间取决于节点能量消耗的特点,设计了节能的MAC协议.提出了一种基于节点流量的低能耗无线传感器网络MAC协议--TBEE-MAC(traffic-based energy efficient MAC).在TBEE-MAC中,节点采用周期性休眠机制来节省能量,提出了活动时间结构和基于节点流量的同步调度方式,在时间误差允许的范围内,调整了同步调度周期,减少了能量消耗.仿真显示,TBEE-MAC在提供低延时性能的基础上,能量有效性相对于S-MAC协议有很大提高.
语种:
中文
展开
基于渡越矩阵的复句关系词自动标注初探
作者:
胡金柱;沈威;杜超华;姚双云;罗进军
期刊:
微计算机信息 ,2007年23(30):200-202 ISSN:1008-0570
作者机构:
[胡金柱; 沈威; 杜超华] 华中师范大学计算机科学系;[姚双云; 罗进军] 华中师范大学语富教育研究中心
关键词:
复旬;关系词;渡越矩阵
摘要:
复句关系词的自动标注是自然语言理解领域的基础性研究课题,是层次关系标注和机器翻译等问题的研究基础。本文采用概率统计方法,建立相应的渡越矩阵研究复句关系词的自动标注方法,并进行了有效标注。标注后。对复句关系词中容易产生歧义的“结果”和“如”进行了封闭性测试和开放性测试,其准确率分别达到98.32%和96.41%,85%和83%。
语种:
中文
展开
肾小管重吸收白蛋白的分子机制及病理意义
作者:
胡金柱;舒江波;周星
期刊:
肾脏病与透析肾移植杂志 ,2006年15(4):350-353 ISSN:1006-298X
作者机构:
[胡金柱; 舒江波] 华中师范大学语言与语言教育研究中心;[周星] 华中师范大学计算机科学系
关键词:
白蛋白;分子机制;病理
摘要:
正常人体由于肾小球的有限滤过以及肾小管重吸收功能,尿液中的白蛋白(albumin,Alb)含量极为有限.但当免疫或非免疫因素损害肾小球滤过屏障或者肾小管功能发生障碍时,尿中Alb排泄量会显著增加.研究发现,肾小管间质病变进展速度与尿蛋白含量有关,降低尿蛋白可延缓肾脏疾病进展[1].Alb作为肾小球滤液中最重要的一种蛋白质,可以激活肾小管上皮细胞内核转录因子κB(NF-κB),诱导炎性浸润、细胞凋亡以及间质纤维化,进而导致肾小管萎缩和肾功能减退[2].本文旨在对近来有关肾小管重吸收Alb的研究作一综述.
语种:
中文
展开