话题性话语标记的自动识别与分类
作者:
杨进才;余漠洋;胡满;肖明
期刊:
计算机科学 ,2024年CSCD ISSN:1002-137X
作者机构:
华中师范大学计算机学院;华中师范大学语言与语言教育研究中心
摘要:
话语标记(Discourse Markers)是一种语言标记,具有组织语篇、引导指意、显示情感的作用,因而受到语言学界广泛关注。对话语标记及其类别的准确识别对篇章理解、说话人意图和情感的把握有重要作用。近十年来,国内外学者对话语标记的功能、特征、来源和系统分类展开研究并取得了丰富的成果。然而因话语标记形式多变、来源多样、特征抽象、变体繁多,机器自动识别的难度较大。该文以话题性话语标记为研究对象,提出一种融合外部语言学特征的NFLAT指针网络模型,实现对语篇中话语标记的自动识别和分类。经实验检验,训练后模型对话题性话语标记的识别及分类精确率(P值)达94.55%。
语种:
中文
展开
Fusion weighted features and BiLSTM-attention model for argument mining of EFL writing
作者:
Yang, Jincai;Zheng, Meng;Liu, Yingliang
期刊:
FRONTIERS IN PSYCHOLOGY ,2023年14:1049266 ISSN:1664-1078
通讯作者:
Liu, Y.
作者机构:
[Zheng, Meng; Yang, Jincai] Cent China Normal Univ, Sch Comp Sci, Wuhan, Peoples R China.;[Liu, Yingliang] Wuhan Univ Technol, Sch Foreign Languages, Wuhan, Peoples R China.
通讯机构:
[Liu, Y.] S;School of Foreign Languages, China
关键词:
argument mining;artificial intelligence;deep learning;EFL writing;Toulmin’s model
摘要:
Argument mining (AM), an emerging field in natural language processing (NLP), aims to automatically extract arguments and the relationships between them in texts. In this study, we propose a new method for argument mining of argumentative essays. The method generates dynamic word vectors with BERT (Bidirectional Encoder Representations from Transformers), encodes argumentative essays, and obtains word-level and essay-level features with BiLSTM (Bi-directional Long Short-Term Memory) and attention training, respectively. By integrating these two levels of features we obtain the full-text features so that the content in the essay is annotated according to Toulmin’s argument model. The proposed method was tested on a corpus of 180 argumentative essays, and the precision of automatic annotation reached 69%. The experimental results show that our model outperforms existing models in argument mining. The model can provide technical support for the automatic scoring system, particularly on the evaluation of the content of argumentative essays. Copyright © 2023 Yang, Zheng and Liu.
语种:
英文
展开
基于特征融合的无标复句关系识别
作者:
杨进才;马晨;肖明
期刊:
计算机科学 ,2023年50(S2):69-74 ISSN:1002-137X
作者机构:
[杨进才; 马晨] 华中师范大学计算机学院;[肖明] 华中师范大学语言与语言教育研究中心
关键词:
无标复句;特征融合;深度学习
摘要:
无标复句因缺少关联词的辅助,其关系识别为自然语言处理中的一项较为困难的任务。将词性特征融入到词向量中,训练得到含有外部特征的词向量表示,通过组合BERT模型与BiLSTM模型,将字向量、词向量、词性向量结合进行训练,并在特征融合层添加BiLSTM模型捕获的极性特征信息以及CNN模型捕获的依存句法特征信息。实验结果表明,该方法在汉语复句分类上取得了较好的效果,与基准模型相比在宏F1值与微F1值上均有提升,在顶层分类上取得了83.67%的微F1值,在第二层分类上取得了68.28%的微F1值。
语种:
中文
展开
社会文化活动理论视域下人机协同教学及应用探索——以iWrite协同英语写作教学为例
作者:
刘应亮;刘胜蓝;杨进才
期刊:
中国电化教育 ,2022年(11):108-116 ISSN:1006-9860
作者机构:
[刘应亮] 武汉理工大学.外国语学院;[刘胜蓝] 武汉市第三十九中学.;[杨进才] 华中师范大学.计算机学院
关键词:
社会文化活动理论;教育人工智能;英语写作教学;人机协同
摘要:
以人工智能为代表的新一代信息技术的发展与应用,为教学带来了新的方法。运用智能技术来辅助教和学的人机协同教学模式已逐步用于各类教学中。该文基于社会文化活动理论,依托iWrite英语写作教学与评阅系统,构建了一个人机协同的英语写作教学模型,设计了教学过程,在充分发挥模型中各个元素的作用的同时,突出了模型中各个要素的互动与协作。教学实践研究结果表明,中介工具辅助的人机协同教学,充分发挥了辅助工具的作用,提高了教学效率;能加强师生之间以及学生之间的及时互动,促进学生个体进行自主学习;有利于发掘教学中的重点与难点以及学生的个体问题,实现精准教学。
语种:
中文
展开
基于ERNIE-Gram和TinyBERT混合模型的复句关系体系转换
作者:
杨进才;陈雪松;胡泉;蔡旭勋
期刊:
中文信息学报 ,2022年36(12):16-26 ISSN:1003-0077
作者机构:
[杨进才] 华中师范大学计算机学院;华中师范大学计算机学院,,武汉中学;[胡泉; 蔡旭勋] 华中师范大学人工智能教育学部;[陈雪松] 华中师范大学计算机学院<&wdkj&>武汉中学
关键词:
复句
摘要:
复句关系是指分句间的语义关系.目前关于复句关系的分类体系有很多,复句三分系统与HIT-CDTB分类体系为其代表.对不同分类体系各类别进行相互转换可以为机器翻译等任务提供支持.该文基于预训练模型ERNIE-Gram和TinyBERT,嵌入主成分分析方法,提出一种三阶段复句关系识别混合模型,实现三分系统与HIT-CDTB两种分类体系下复句关系的转换.通过实验检验,复句三分系统到HIT-CDTB以及HIT-CDTB到复句三分系统关系转换的准确率分别达到77.60%、89.17%.
语种:
中文
展开
基于DPCNN模型与语句特征融合的汉语因果类复句关系自动识别
作者:
杨进才;曹元;胡泉
期刊:
中文信息学报 ,2022年36(9):19-27 ISSN:1003-0077
作者机构:
[曹元; 杨进才] 华中师范大学计算机学院;[胡泉] 华中师范大学教育信息技术学院
关键词:
因果类复句;关系识别;词向量;DPCNN模型;依存句法
摘要:
汉语复句关系识别是对复句语义关系的识别,复句关系类别的自动识别对促进语言学和中文信息处理的研究有重要的价值。因果类复句是使用频率最高的复句,文中以二句式有标广义因果复句为研究对象,使用语言技术平台LTP进行依存句法分析,获得词性、依存父节点的词序、与父节点的依存关系等特征,将特征的不同组合与预训练的词向量拼接,得到新的向量,将新的向量输入到DPCNN模型中来进行关系类别识别。通过实验对提出的方法进行检验,实验结果显示:与未融合任何特征相比,DPCNN模型中融合语句特征使实验结果的指标均有提升,表明融合语句特征能取得更好的识别效果。在各种特征组合中,融合POS特征组合得到的准确度和F1值最高,分别为98.41%, 98.28%。
语种:
中文
展开
基于BERT-FHAN模型融合语句特征的汉语复句关系自动识别
作者:
杨进才;曹煜欣;胡泉;蔡旭勋
期刊:
计算机系统应用 ,2022年31(9):233-240 ISSN:1003-3254
作者机构:
华中师范大学计算机学院,武汉430079;华中师范大学人工智能教育学部,武汉430079;[杨进才; 蔡旭勋; 胡泉; 曹煜欣] 华中师范大学
关键词:
复句关系识别;词性;句法依存;语义依存;BERT模型;HAN模型
摘要:
复句关系是指复句分句之间的逻辑语义关系,复句关系识别是对分句间语义关系的甄别,是自然语言处理中的难点问题.本文以有标复句为研究对象,提出了一种BERT-FHAN模型,该模型利用BERT模型获取词向量,在HAN模型中融入关系词本体知识以及词性、句法依存关系、语义依存关系特征.通过实验对提出的模型进行验证, BERT-FHAN模型取得的最高宏平均F1值和准确率分别为95.47%与96.97%,表明了本文方法的有效性.
语种:
中文
展开
基于学科知识图谱的高校教学模式研究
作者:
张勇;杨进才
期刊:
计算机教育 ,2021年(06):141-144 ISSN:1672-5913
作者机构:
华中师范大学 计算机学院,湖北 武汉 430079;[杨进才; 张勇] 华中师范大学
关键词:
学科知识图谱;知识地图;学习画像;学习资源推荐
摘要:
为了使高校教学工作更智能化,提出一种基于学科知识图谱的高校教学模式,尝试挖掘和构建学科内在的知识关联结构,构建面向教育信息化和智能化的学科知识图谱,以辅助传统课堂教学,提高高等教育的教学质量,并以计算机学科为例,从智能化的在线微课教学、考核评估、学习资源推荐等方面阐述了学科知识图谱在高校教学中的应用。
语种:
中文
展开
基于语义依存关系的汉语复句关系词自动识别
作者:
杨进才;郑雷;胡泉
期刊:
计算机与数字工程 ,2021年49(08):1531-1537,1618 ISSN:1672-9722
作者机构:
华中师范大学计算机学院 武汉 430079;[杨进才; 胡泉; 郑雷] 华中师范大学
关键词:
复句关系词;语义依存关系;随机森林;自动识别
摘要:
复句关系词自动识别是复句层次识别以及对复句语义理解的基础。目前,汉语关系词的自动识别主要根据字面特征与句法特征,未涉及到语义特征的分析。论文利用哈工大的LTP平台,分析句子的语义依存关系,提取语义特征,建立语义依存特征库,运用随机森林方法自动识别复句关系词。复句关系词识别正确率92.32%,F1值为92.31%。实验结果表明了该方法的有效性。
语种:
中文
展开
基于规则的有标复句关系的自动识别
作者:
杨进才;胡巧玲;胡泉
期刊:
计算机科学 ,2021年48(S2):124-129 ISSN:1002-137X
作者机构:
[胡巧玲; 杨进才] 华中师范大学计算机学院;[胡泉] 华中师范大学人工智能教育学部
关键词:
有标复句;复句关系分类;规则;自动识别
摘要:
汉语复句的语义表达复杂,复句关系分类问题作为汉语篇章研究与应用的重要内容,一直是自然语言处理领域关注的热点。文中总结与挖掘出复句类别自动识别的十几类字面、句法特征,将特征形式化为规则,用关系词触发规则的机制,对有标复句进行十二类关系类别的识别。实验结果表明该方法取得了较高的准确率,优于现有的方法。
语种:
中文
展开
基于词义增强和注意力机制的Twitter情感分析研究
作者:
蔡旭勋;杨进才
期刊:
计算机与数字工程 ,2021年49(11):2266-2270 ISSN:1672-9722
作者机构:
华中师范大学计算机学院,武汉430070
关键词:
深度学习;情感分析;注意力机制;词义增强
摘要:
为了将词义信息和语义信息更好的与句子进行融合,论文提出一种基于词义增强和注意力机制的Twitter情感分析方法。通过对Twitter中的单词进行词义和语义信息的补充,增加词向量的维度来增强语义;把扩充后词向量表示的文本与情感强度进行配对输入到双向注意力机制的长短时记忆网络(BiLSTM)中。在Twitter数据集上进行普通情感分类、普通情感回归分析、基于Valence-Arousal的维度情感分析。实验结果表明,论文提出的基于词义增强和注意力机制的文本情感分析模型相比于其他模型具有更好的效果。
语种:
中文
展开
基于Transformer模型与关系词特征的汉语因果类复句关系自动识别
作者:
杨进才;曹元;胡泉;沈显君
期刊:
计算机科学 ,2021年48(S1):295-298+305 ISSN:1002-137X
作者机构:
华中师范大学计算机学院 武汉430079;[杨进才; 沈显君; 曹元; 胡泉] 华中师范大学
关键词:
因果复句;关系识别;词向量;transformer模型;深度学习
摘要:
汉语复句的语义关系丰富而复杂,复句关系自动识别是对复句语义关系的判别,是分析复句所表达意义的重要环节。因果类复句是使用最多的汉语复句,文中以二句式有标因果类复句为研究对象,通过深度学习的方法自动挖掘复句隐含的特征,同时融合了关系词这一语言学研究的显著知识。将word2vec词向量与one-hot编码的关系词特征结合作为模型的输入,利用卷积神经网络作为前馈层的transformer模型来对因果复句关系进行识别。采用文中的方法对因果类复句关系类别进行识别,实验结果的F1值达到92.13%,优于现有的对比模型,表明了该方法的有效性。
语种:
中文
展开
基于神经网络的关系词非充盈态复句层次的自动识别
作者:
杨进才;杨璐璐;汪燕燕;沈显君
期刊:
计算机科学 ,2019年46(S2):103-107 ISSN:1002-137X
作者机构:
华中师范大学计算机学院 武汉 430079;[杨进才; 沈显君; 汪燕燕; 杨璐璐] 华中师范大学
关键词:
关系词非充盈态;复句层次划分;依存句法;神经网络
摘要:
复句层次关系划分是复句句法结构分析以及语义甄别的基础,但关系词非充盈态复句由于关系标记的省略给层次划分带来了困难.文中利用依存关系句法树和word2vec词向量模型的方法来提取复句中分句的句法特征和语义特征,并利用神经网络进行训练,获得三句式关系词的非充盈态复句层次划分模型,对测试集中的复句进行层次划分测试,其准确率为74%.
语种:
中文
展开
Predicting LncRNA-disease Association by Autoencoder and Rotation Forest
作者:
Yang, Jincai;Ma, Shunping;Jiang, Xingpeng*
作者机构:
[Jiang, Xingpeng; Yang, Jincai; Ma, Shunping] Cent China Normal Univ, Sch Comp, Wuhan, Peoples R China.
会议名称:
IEEE International Conference on Bioinformatics and Biomedicine (BIBM)
会议时间:
NOV 18-21, 2019
会议地点:
San Diego, CA
会议主办单位:
[Yang, Jincai;Ma, Shunping;Jiang, Xingpeng] Cent China Normal Univ, Sch Comp, Wuhan, Peoples R China.
会议论文集名称:
IEEE International Conference on Bioinformatics and Biomedicine-BIBM
关键词:
lncRNA;disease;autoencoder;rotation forest
摘要:
In the past few years, most disease-related lncRNAs have been identified, but the experimental identification is cost-consuming and time-consuming. It is therefore very important to develop a reliable computational model to predict lncRNA-disease association. In this paper, we propose a method based on similarity, combining autoencoder and rotation forest to predict lncRNA-disease association (SARLDA). This method not only makes use of disease and lncRNA similarities, but also extracts latent low-dimension features and expand the gap between samples to make it easier to predict the associations. To evaluate our method, we conducted several experiments. Sufficient validations show that this method has significantly improved the prediction performance.
语种:
英文
展开
An Improved Biomedical Event Trigger Identification Framework via Modeling Document with Hierarchical Attention
作者:
Zhang, Jinyong;Fang, Dandan;Zhao, Weizhong* ;Yang, Jincai;Zou, Wen;...
作者机构:
[Zhang, Jinyong; Zhao, Weizhong; Fang, Dandan; He, Tingting; Jiang, Xingpeng; Yang, Jincai] Cent China Normal Univ, Sch Comp, Wuhan, Peoples R China.;[Zhao, Weizhong] Cent China Normal Univ, Hubei Key Lab Artificial Intelligence & Smart Lea, Wuhan, Peoples R China.;[Zhao, Weizhong] Guilin Univ Elect Technol, Guangxi Key Lab Trusted Software, Guilin, Peoples R China.;[Zou, Wen] US FDA, Div Bioinformat & Biostat, Natl Ctr Toxicol Res, Jefferson, AR 72079 USA.
会议名称:
IEEE International Conference on Bioinformatics and Biomedicine (BIBM)
会议时间:
NOV 18-21, 2019
会议地点:
San Diego, CA
会议主办单位:
[Zhang, Jinyong;Fang, Dandan;Zhao, Weizhong;Yang, Jincai;Jiang, Xingpeng;He, Tingting] Cent China Normal Univ, Sch Comp, Wuhan, Peoples R China.^[Zhao, Weizhong] Cent China Normal Univ, Hubei Key Lab Artificial Intelligence & Smart Lea, Wuhan, Peoples R China.^[Zhao, Weizhong] Guilin Univ Elect Technol, Guangxi Key Lab Trusted Software, Guilin, Peoples R China.^[Zou, Wen] US FDA, Div Bioinformat & Biostat, Natl Ctr Toxicol Res, Jefferson, AR 72079 USA.
会议论文集名称:
IEEE International Conference on Bioinformatics and Biomedicine-BIBM
关键词:
biomedical event trigger identification;end-to-end model;hierarchical attention mechanism;adaptive class weight learning
摘要:
Biomedical event extraction has wide applications in biomedicine field. As a prerequisite step in biomedical event extraction, event trigger identification has attracted growing attention in biomedical research. Although many approaches have been proposed for biomedical event trigger identification, two main challenges still remain for researchers: 1) most of the existing approaches treat each sentence separately in biomedical documents, failing to make full use of the semantics in the global document context; 2) the sparseness of event triggers leads to a serious issue of imbalanced class for trigger identification. In this paper, we propose an end-to-end framework for biomedical event trigger identification which addresses effectively the two mentioned challenges accordingly. Specifically, a hierarchical attention mechanism is used to model the global document context, including the semantic relationships both among words in the same sentence and among sentences in the same document. In addition, an adaptive class weight learning method is proposed to treat the class imbalance issue in biomedical event trigger identification. Experimental results on two commonly used datasets demonstrate the effectiveness of the proposed framework.
语种:
英文
展开
Hypergraph Clustering Based on Intra-class Scatter Matrix for Mining Higher-order Microbial Module
作者:
Yu, Limin;Shen, Xianjun* ;Jiang, Xingpeng* ;Yang, Jincai;Yang, Yujuan;...
作者机构:
[Shen, Xianjun; Shen, XJ; Jiang, Xingpeng; Yu, Limin; Yang, Yujuan; Zhong, Duo; Yang, Jincai] Cent China Normal Univ, Sch Comp, Wuhan, Peoples R China.;[Shen, Xianjun; Shen, XJ; Jiang, Xingpeng; Yu, Limin; Yang, Yujuan; Zhong, Duo; Yang, Jincai] Cent China Normal Univ, Hubei Prov Key Lab Artificial Intelligence & Smar, Wuhan, Hubei, Peoples R China.
会议名称:
IEEE International Conference on Bioinformatics and Biomedicine (BIBM)
会议时间:
NOV 18-21, 2019
会议地点:
San Diego, CA
会议主办单位:
[Yu, Limin;Shen, Xianjun;Jiang, Xingpeng;Yang, Jincai;Yang, Yujuan;Zhong, Duo] Cent China Normal Univ, Sch Comp, Wuhan, Peoples R China.^[Yu, Limin;Shen, Xianjun;Jiang, Xingpeng;Yang, Jincai;Yang, Yujuan;Zhong, Duo] Cent China Normal Univ, Hubei Prov Key Lab Artificial Intelligence & Smar, Wuhan, Hubei, Peoples R China.
会议论文集名称:
IEEE International Conference on Bioinformatics and Biomedicine-BIBM
关键词:
Higher-order microbial module;Intra-class scatter matrix;Hypergraph clustering
摘要:
Microbial ecosystems are complex, by analyzing co-occurrence modules of microbial communities, we can better understand the conditions of microbial interactions in each environment, and help understand the interaction patterns that maintain the stability of microbial communities. Imbalances in human microbiome are closely related to human disease. Previous modular clustering analysis was based only on the relationship between paired microorganisms. In this paper, we propose calculating the logical relationship between microbial triplet in human body by information entropy and construct a hypergraph based on the triplet network. Based on the hypergraph clustering, we proposed a novel hypergraph clustering algorithm based on intra-class scatter matrix (HCIS) to reconstruct hyperedge similarity, and selected the optimal cluster number by maximizing modularity to analyze higher-order module of microorganisms. The clustering results verify the effectiveness and feasibility of HCIS algorithm for higher-order microbial module analysis.
语种:
英文
展开
A Novel Approach Based on Bi-Random Walk to Predict Microbe-Disease Associations
作者:
Shen, Xianjun* ;Zhu, Huan;Jiang, Xingpeng;Hu, Xiaohua;Yang, Jincai
作者机构:
[Shen, Xianjun; Hu, Xiaohua; Zhu, Huan; Jiang, Xingpeng; Yang, Jincai] Cent China Normal Univ, Sch Comp, Wuhan, Hubei, Peoples R China.;[Hu, Xiaohua] Drexel Univ, Coll Comp & Informat, Philadelphia, PA 19104 USA.
会议名称:
14th International Conference on Intelligent Computing, ICIC 2018
会议时间:
15 August 2018 through 18 August 2018
会议地点:
Wuhan, PEOPLES R CHINA
会议主办单位:
[Shen, Xianjun;Zhu, Huan;Jiang, Xingpeng;Hu, Xiaohua;Yang, Jincai] Cent China Normal Univ, Sch Comp, Wuhan, Hubei, Peoples R China.^[Hu, Xiaohua] Drexel Univ, Coll Comp & Informat, Philadelphia, PA 19104 USA.
会议论文集名称:
Lecture Notes in Artificial Intelligence
关键词:
Forecasting;Intelligent computing;Random processes;Statistical methods;Bi-random walks;Clinical observation;Common disease;Computational predictions;Cross validation;Disease associations;Leave-one-out cross-validation (LOOCV);Potential microbes;Bacteria
摘要:
An increasing number of clinical observations have confirmed that the microbes inhabiting in human body have critical impacts on the progression of human disease, which provides promising insights into understanding the mechanism of diseases. However, the known microbe-disease associations remain limited. So, we proposed Bi-Random Walk based on Multiple Path (BiRWMP) to predict microbe-disease associations. Leave-one-out cross-validation (LOOCV) and 5-fold cross-validation were adopted to demonstrate the capability of proposed method. BiRWMP performed better than other methods. Finally, we listed 2 common disease and potential microbes ranked at top 10, and we demonstrated its reasonableness through looking up literatures. © 2018, Springer International Publishing AG, part of Springer Nature.
语种:
英文
展开