基于语义与规则的有标复句层次体系研究
作者:
李源;刁胜权;胡金柱;翟宏森;杨梦川;...
期刊:
计算机工程与科学 ,2017年39(12):2306-2313 ISSN:1007-130X
作者机构:
[李源; 刁胜权; 胡金柱; 翟宏森; 杨梦川; 黄文灿] 华中师范大学计算机学院, 湖北, 武汉, 430079
关键词:
汉语复句;层次关系;语义;挖掘;规则;移进-规约
摘要:
汉语复句层次关系分析是中文信息处理领域极具挑战性的课题之一。为解决关系词标识信息不充足所导致的复句层次关系识别准确率下降问题,挖掘了影响分句关联的形式化语义知识,在此基础上构建了小句关联体识别算法并将其应用于相应的复句层次判定规则之中,以辅助分析其层次关系;对于其余单、多重有标复句的层次识别,使用基于搭配规则的移进-归约算法;最后提出了一种语义与规则相结合的复句层次分析模型。实验结果表明,此方法在一定程度上提高了复句层次关系识别的准确率。
语种:
中文
展开
一种快速挖掘top-k高效用模式的算法
作者:
吴倩;王林平;罗相洲;崔建群;王海
期刊:
计算机应用研究 ,2017年34(11):3303-3307 ISSN:1001-3695
作者机构:
华中师范大学计算机学院, 武汉, 430079;华中师范大学科技处, 武汉, 430079;[吴倩; 王林平; 罗相洲; 崔建群] 华中师范大学计算机学院, 武汉, 430079;[王海] 华中师范大学科技处, 武汉, 430079
关键词:
高效用模式;top-k模式挖掘;效用挖掘;数据挖掘
摘要:
高效用模式挖掘是数据挖掘领域的一个基础研究方向,其中关于top-k高效用模式的挖掘算法也越来越多,k指的是用户需要挖掘的高效用模式的个数。它们可以归纳为二阶段top-k算法和一阶段top-k算法两类,两者的主要区别是,前者在挖掘的过程中会产生大量的候选模式,这是影响算法性能的主要因素;后者在挖掘的过程中不产生候选模式。为了更加高效地挖掘效用值最高的k个模式,一阶段算法TKHUP被提出,该算法在进行数据挖掘的过程中主要是通过四个有效策略来减少时间和空间的消耗。通过大量的实验数据表明,TKHUP在时间性能上优于其他top-k高效用模式挖掘算法。
语种:
中文
展开
间距判别投影及其在表情识别中的应用
作者:
甘炎灵;金聪
期刊:
计算机应用 ,2017年37(5):1413-1418 ISSN:1001-9081
作者机构:
[甘炎灵; 金聪] 华中师范大学计算机学院, 武汉, 430079
关键词:
降维;间距;判别投影;类间离散度;类内离散度;表情识别
摘要:
针对全局降维方法判别信息不足,局部降维方法对邻域关系的判定存在缺陷的问题,提出一种新的基于间距的降维方法——间距判别投影(MDP)。首先,根据类的中心均值的异类近邻关系定义描述类边缘的边界向量;在这个基础上,MDP重新定义类间离散度矩阵,同时,使用全局的方法构造类内离散度矩阵;然后,MDP借鉴判别分析思想建立衡量类间距的准则,并通过类间距最大化增强样本在投影空间中的可分性。对MDP在人脸表情数据库JAFFE和Extended Cohn-Kanade上进行表情识别实验,并且跟传统的降维方法主成分分析(PCA)、最大间距准则(MMC)和边界Fisher分析(MFA)进行对比,实验结果表明,所提算法能够有效提取更具区分性的低维特征,比其他几种方法分类精度更高。
语种:
中文
展开
一种新的超轻量级RFID认证协议
作者:
张亚力;郭亚军;崔建群
( 崔建群 ) ;曾庆江#ZHANG Ya-li;GUO Ya-jun;...
期刊:
计算机科学 ,2017年44(1):183-187 ISSN:1002-137X
作者机构:
[崔建群; 张亚力; 郭亚军; 曾庆江#ZHANG Ya-li] 华中师范大学计算机学院, 武汉, 430079
关键词:
无线射频识别;超轻量级;双向认证
摘要:
RFID(无线射频识别)技术以无线通信的方式广泛运用于生活生产的各个领域,如门禁设备、支付设备等,但阅读器和标签之间无线开放的通信环境使得RFID设备面临更多的恶意攻击和安全威胁。低成本标签只具有非常有限的计算能力和存储空间,一般的分组密码和hash函数等都不能用于低成本标签中。为了解决低成本标签的安全性问题,采用比特位运算密码原语,提出一种新的超轻量级RFID认证协议-SIUAP。SIUAP协议在SIMON类算法的超轻量级轮函数F(x)和非线性函数MIXBITS运算的基础上,使用3种简单的比特位运算:比特AND运算、异或运算和循环移位运算,大大降低了计算复杂度。通过GNY逻辑对协议进行形式化的分析,证明了SIUAP协议能够实现阅读器和标签双向合法身份的认证,同时对SIUAP进行安全性分析。与现有的超轻量级认证协议相比,SIUAP协议具有较小的计算开销,能够满足RFID系统低成本、高安全性的需求。
语种:
中文
展开
基于MapReduce的top-k高效用模式挖掘算法
作者:
吴倩;王林平;罗相洲;崔建群;王海
期刊:
计算机应用研究 ,2017年34(10):2897-2900,2932 ISSN:1001-3695
作者机构:
华中师范大学计算机学院, 武汉, 430079;华中师范大学科技处, 武汉, 430079;[吴倩; 王林平; 罗相洲; 崔建群] 华中师范大学计算机学院, 武汉, 430079;[王海] 华中师范大学科技处, 武汉, 430079
关键词:
数据挖掘;高效用模式;并行算法
摘要:
高效用模式挖掘被广泛地应用于数据挖掘领域。为了挖掘指定数量的高效用模式,一些基于树结构和效用表结构的top-k高效用挖掘算法被提出,但前者在挖掘过程中产生了大量候选模式,后者在效用模式增长时需要进行多次比较;同时,由于在信息社会,数据量呈爆炸性增长,所以在数据集过大的情况下,挖掘高效用模式需以大量存储空间以及计算开销为代价。为了解决这两个问题,基于MapReduce的top-k高效用模式挖掘算法(TKHUP_MaR)被提出。该算法通过两次扫描数据库,利用三次MapReduce来实现并行top-k高效用模式的挖掘。通过实验表明TKHUP_MaR算法在并行挖掘top-k高效用模式的过程中是有效的。
语种:
中文
展开
基于加速度轨迹图像的手势特征提取与识别
作者:
刘蓉;刘家祺;刘红
期刊:
计算机应用研究 ,2017年34(3):924-927 ISSN:1001-3695
作者机构:
华中师范大学物理科学与技术学院, 武汉, 430079;华中师范大学计算机学院, 武汉, 430079;[刘蓉; 刘红] 华中师范大学物理科学与技术学院, 武汉, 430079;[刘家祺] 华中师范大学计算机学院, 武汉, 430079
关键词:
手势识别;加速度传感器;非负矩阵分解;隐马尔可夫模型;人机交互
摘要:
针对手势加速度识别中存在数据维度高、计算量大等问题,提出一种基于加速度轨迹图像的手势NMF特征提取与识别方法。通过Wiimote手柄获取手势动作的加速度信号,经过实时有效手势动作分割后,将加速度数据转换为手势轨迹图像,并用非负矩阵分解对手势加速度轨迹图像提取特征向量,最后构建离散隐马尔可夫模型实现目标手势识别。加速度手势轨迹图像转换及采用非负矩阵分解的特征提取方法将未知手势轨迹特征转换为低维子特征序列,降低了计算复杂度,实验表明,该方法能有效识别手势动作。
语种:
中文
展开
二值矩阵分解的认知建模方法研究
期刊:
计算机科学 ,2017年44(10):265-268 ISSN:1002-137X
作者机构:
华中师范大学计算机学院, 教育信息化协同创新中心, 武汉, 430079;中国地质大学(武汉)数学与物理学院, 武汉, 430074;华中师范大学计算机学院, 武汉, 430079;[何婷婷; 杨青] 华中师范大学计算机学院, 武汉, 430079;[张猛] 华中师范大学计算机学院, 教育信息化协同创新中心, 武汉, 430079
关键词:
认知建模;二值矩阵分解;考题分类;学生成绩预测
摘要:
根据考试反馈数据,提出新颖的逻辑斯提克二值矩阵分解方法,来预测未来的学生考试成绩并自动对考题进行模式分类,同时设计新的算法对建模中遇到的非凸优化问题进行求解。在模拟数据和真实的美国SAT考试数据上进行的实验发现,新方法不仅可以准确地预测学生的考试表现,而且能够将考题按照知识点进行自动模式分类。实验结果表明,新的方法相比经典方法在结果的可解释性和估计精度方面有明显的提升。
语种:
中文
展开
一种车联网环境下的城市车辆协同选路方法
作者:
吴黎兵;范静;聂雷;崔建群
( 崔建群 ) ;邹逸飞#WU Li-Bing;...
期刊:
计算机学报 ,2017年40(7):1600-1613 ISSN:0254-4164
作者机构:
[吴黎兵] State Key Laboratory of Software Engineering, Wuhan University, Wuhan, 430072, China;[崔建群] Computer School, Central China Normal University, Wuhan, 430079, China;[ZOU Yi-Fei; 吴黎兵; NIE Lei; 范静] Computer School, Wuhan University, Wuhan, 430072, China
关键词:
车辆导航系统;智能交通系统;车辆选路问题;路径规划;车联网
摘要:
随着智能导航设备的不断普及,越来越多的驾驶员使用智能导航设备来选择自己的行驶路径.现有的选路方法往往采用城市道路地理信息、历史行驶信息以及交通信息中心提供的实时交通状态来进行路径的规划.而城市车辆数目增加使得车辆间的相互作用逐渐成为了影响车辆行驶时间的主要因素之一,现有的选路方法已经无法满足现今城市的导航需求.因此有必要设计一种能够考虑选路车辆间相互作用的新型选路算法来应对这种新的变化.该文首先对车辆运动过程中的相互作用进行了研究,并量化了车辆选路行为对其他车辆的影响,进而提出了一种车联网环境下的城市车辆协同选路方法(Collaborative Route Planning,CoRP).该方法通过收集并分析联网车辆的行驶规划信息,在为车辆提供更适用于实际交通情况的路径规划方案的同时减少车辆选路行为对其它车辆带来的负面影响.仿真实验表明,相较于现有的选路方法,该方法能够提升城市车辆选路的协同性,降低了18%~ 30%的道路最大滞留车辆数目,并减少了14%~29%的车辆整体行驶时间开销,在很大程度上改善了城市道路拥塞的情况.
语种:
中文
展开
语言先验知识对神经网络模型自然语言处理任务的影响
作者:
贝超;胡珀
期刊:
中文信息学报 ,2017年31(6):10-17 ISSN:1003-0077
作者机构:
[贝超; 胡珀] 华中师范大学计算机学院, 湖北, 武汉, 430079
会议名称:
第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会
会议时间:
2017-10-13
会议地点:
南京
会议论文集名称:
第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会论文集
关键词:
神经网络;自然语言处理;先验知识
摘要:
随着互联网的发展及硬件的更新,神经网络模型被广泛应用于自然语言处理、图像识别等领域。目前,结合传统自然语言处理方法和神经网络模型正日益成为研究的热点。引入先验知识代表了传统方法的惯例,然而它们对基于神经网络模型的自然语言处理任务的影响尚不清楚。鉴于此,该文尝试探究语言层先验知识对基于神经网络模型的若干自然语言处理任务的影响。根据不同任务的特点,比较了不同先验知识和不同输入位置对不同神经网络模型的影响。通过大量的对比实验发现:先验知识并不是对所有任务都适用,在神经网络模型的合适位置加入合适的先验知识方可加快模型的收敛速度,提高相关任务的效果。
语种:
中文
展开
Topic enhanced deep structured semantic models for knowledge base question answering
作者:
Xie, Zhiwen;Zeng, Zhao;Zhou, Guangyou* ;Wang, Weijun
期刊:
中国科学:信息科学(英文版) ,2017年60(11):110103-1-110103-15 ISSN:1674-733X
通讯作者:
Zhou, Guangyou
作者机构:
[Zeng, Zhao; Zhou, Guangyou; Xie, Zhiwen] Cent China Normal Univ, Sch Comp, Wuhan 430079, Hubei, Peoples R China.;[Wang, Weijun; Zhou, Guangyou] Cent China Normal Univ, Minist Educ, Key Lab Adolescent Cyberpsychol & Behav, Wuhan 430079, Hubei, Peoples R China.
通讯机构:
[Zhou, Guangyou] C;Cent China Normal Univ, Sch Comp, Wuhan 430079, Hubei, Peoples R China.;Cent China Normal Univ, Minist Educ, Key Lab Adolescent Cyberpsychol & Behav, Wuhan 430079, Hubei, Peoples R China.
关键词:
question answering;deep learning;knowledge base;semantic matching;topic entity
摘要:
Knowledge Base Question Answering (KBQA) is a hot research topic in natural language processing (NLP). The most challenging problem in KBQA is how to understand the semantic information of natural language questions and how to bridge the semantic gap between the natural language questions and the structured fact triples in knowledge base. This paper focuses on simple questions which can be answered by a single fact triple in knowledge base. We propose a topic enhanced deep structured semantic model for KBQA. The proposed method considers the task of KBQA as a matching problem between questions and the subjects and predicates in knowledge base. And the proposed model consists of two stages to match the subjects and predicates, respectively. In the first stage, we propose a Convolutional based Topic Entity Extraction Model (CTEEM) to extract topic entities mentioned in questions. With the extracted entities, we can retrieve the relevant candidate fact triples from knowledge base and obviously decrease the amount of noising candidates. In the second stage, we employ Deep Structured Semantic Models (DSSMs) to compute the semantic relevant score between questions and predicates in the candidates. And we combine the semantic level and the lexical level scores to rank the candidates. We evaluate the proposed method on KBQA dataset released by NLPCC-ICCPOL 2016. The experimental results show that our proposed method achieves the third place among the 21 submitted systems. Furthermore, we also extend the DSSM by using BiLSTM and integrate a convolutional structure on the top of BiLSTM layers. Our experimental results show that the extension models can further improve the performance.
语种:
英文
展开
基于自适应分数阶微分的引导滤波及其应用
期刊:
计算机应用研究 ,2017年34(1):283-286,301 ISSN:1001-3695
作者机构:
[谢伟; 游敏; 周玉钦] 华中师范大学计算机学院, 武汉, 430079
关键词:
保边平滑;分数阶微分;掩模;局部方差;人脸识别
摘要:
引导滤波算法具有保边平滑的功能,但传统引导滤波方法容易导致图像平滑区域过度模糊、细节丢失的问题。为了使引导滤波在保持高频信息的同时结构化输出低频灰度,提出了一种基于自适应分数阶微分的引导滤波算法。以分数阶微分理论为基础定义了分数阶微分掩模,并结合图像梯度、二维信息熵和局部方差权值构造了自适应分数阶微分阶数函数来有效检测图像纹理和梯度变化,从而将图像局部特性转移到引导图像中,确保在平滑去噪的同时保持图像纹理细节。实验结果表明,算法具有良好的边缘和纹理保持特性,将算法运用到基于PCA和SVM的人脸识别图像预处理中,能一定程度地提升人脸识别率。
语种:
中文
展开
量子混沌与折叠算法的图像加密系统
作者:
金聪;刘会
期刊:
光学精密工程 ,2017年25(3):749-755 ISSN:1004-924X
通讯作者:
Jin, Cong(jinc26@aliyun.com)
作者机构:
[金聪; 刘会] School of Computer, Central China Normal University, Wuhan;430079, China;[金聪; 刘会] 430079, China
通讯机构:
[Jin, C.] S;School of Computer, Central China Normal University, Wuhan, China
关键词:
量子混沌映射;Logistic映射;Arnold变换;折叠操作;差分攻击
摘要:
本文提出一种量子混沌与折叠算法相结合的图像加密系统。该系统的主要思想是通过量子混沌映射和二维 Logistic映射分别进行Arnold变换,得到两个由伪随机数组成的与灰度图像大小相等的矩阵Q、E,然后利用这两个矩阵对图像分别进行以下操作:一是利用矩阵Q对图像从4个方向进行“折叠操作”,二是使用前一个像素值与当前像素值进行异或,然后将异或得到的值加上E对应的值,以对当前像素值进行修改,从而达到图像扩散的效果,增加差分攻击的难度。利用MATLAB对测试图像进行模拟仿真分析,结果显示,经该加密系统加密后的图像,其水平、竖直和对角线方向像素值的相关性分别为0.001 006、0.000 152、0.000 789,信息熵H(s)=7.997 3。一系列的实验结果表明该加密系统具有很高的安全性和随机性。
语种:
中文
展开
基于汉语复句的语义相关度计算及类别的标识
期刊:
计算机科学 ,2017年44(5):280-284 ISSN:1002-137X
作者机构:
[杨进才; 陈忠忠; 沈显君; 胡金柱] 华中师范大学计算机学院, 武汉, 430079
关键词:
复句;语义相关度;关系标记;关系类别
摘要:
语义相关度计算作为中文信息处理领域中的一项关键技术,在信息检索、语义消岐、文本分类中起着重要的作用。利用汉语复句的句法理论和关系标记搭配理论,以汉语复句语料库以及搜索引擎获取的复句为语料,提出了一种基于汉语复句的语义相关度计算方法—SRCCS。本方法不仅能够计算词语的相关度,而且能够表明相关的性质与类别。与通过短文计算相关度的方法相比,本方法选取的计算对象范围更小,因而结果更准确,计算复杂度更低。在同一测试集上与搜索引擎方法的对比分析证明了基于汉语复句的语义相关度计算方法的有效性与优越性。
语种:
中文
展开
文本分类中CTM 模型的优化和可视化应用研究
作者:
马长林;杨正良;谢罗迪
期刊:
计算机工程与科学 ,2017年39(3):599-604 ISSN:1007-130X
作者机构:
[马长林; 杨正良; 谢罗迪] 华中师范大学计算机学院, 湖北, 武汉, 430079
关键词:
文本分类;CTM 模型;特征提取
摘要:
如何从海量文本中自动提取相关信息已成为巨大的技术挑战,文本分类作为解决该问题的重要方法已引起广大关注,而其中文本表示是影响分类效果的关键因素。为此采用相关主题模型进行文本表示,以保证信息完整同时表现主题相关性;基于该模型,对主题数目和特征提取实施了优化处理,综合复杂度和对数似然函数来确定最优主题数目,引入基于互信息的主成分分析算法进行最优特征提取,降低数据维度和特征冗余,使用R语言进行可视化实验分析。
语种:
中文
展开
基于连接成本的快递网络拥塞控制
作者:
杨从平;郑世珏;党永杰;杨青
期刊:
中国管理科学 ,2017年25(4):143-151 ISSN:1003-207X
作者机构:
广西民族大学商学院, 广西, 南宁, 530006;华中师范大学计算机学院, 湖北, 武汉, 430079;[杨从平] 广西民族大学商学院, 广西, 南宁, 530006;[郑世珏; 党永杰; 杨青] 华中师范大学计算机学院, 湖北, 武汉, 430079
关键词:
快递网络;图论;拥塞控制;传输能力;连接成本
摘要:
本文采用图论的方法研究快递网络拥塞控制问题。通过分析快递网络流量特性,研究快递网络结构对网络传输能力的影响,平衡网络传输能力和连接成本之间的关系。首先,介绍介数的概念,考虑介数与货物流量的关系,修改了介数定义,并设计了介数的计算方法;接下来,根据介数计算公式推导快递网络传输能力与节点介数和节点能力的关系;然后,构建满足预期网络传输能力的最小连接成本拥塞控制模型,并设计了通过不断加边、重连和删除边的方法迭代寻找最优的快递网络结构;最后通过广西某快递公司的配送网络为算例验证模型和算法的有效性。研究结果显示算法能够有效地找出最优的快递网络,研究发现瓶颈节点的处理能力和介数决定网络的传输能力,网络传输能力与连接成本悖反。
语种:
中文
展开
动态数据库中增量Top-k高效用模式挖掘算法
作者:
吴倩;王林平;罗相洲;崔建群#Wu Qian
( 崔建群 ) ;Wang Linping;...
期刊:
计算机应用研究 ,2017年34(5):1401-1405 ISSN:1001-3695
作者机构:
[崔建群#Wu Qian; 吴倩; 王林平; 罗相洲] 华中师范大学计算机学院, 武汉, 430079
关键词:
增量挖掘;效用挖掘;Top-k模式挖掘;动态数据库
摘要:
高效用模式的挖掘需要设定一个合适的阈值,而阈值设定对用户来说并非易事,阈值过小导致产生大量低效用模式,阈值过大可能导致无高效用模式生成。因而Top-k高效用模式挖掘方法被提出,k指效用值前k大的模式。并且大量的高效用挖掘研究仅针对静态数据库,但在实际应用中常常会遇到新事务的加入的情况。针对以上问题,提出了增量的Top-k高效用挖掘算法TOPK-HUP-INS。算法通过四个有效的策略,在增量数据的情况下,有效地挖掘用户所需数量的高效用模式。通过在不同数据集上的对比实验表明TOPK-HUP-INS算法在时空性能上表现优异。
语种:
中文
展开
基于可比语料库的双语词典抽取方法比较研究
作者:
李舰;李波;陈鹏;杨丹
期刊:
小型微型计算机系统 ,2017年38(7):1554-1561 ISSN:1000-1220
作者机构:
华中师范大学计算机学院, 武汉, 430079;中国电力科学研究院, 武汉, 430074;[李舰; 李波; 陈鹏] 华中师范大学计算机学院, 武汉, 430079;[杨丹] 中国电力科学研究院, 武汉, 430074
关键词:
可比语料库;双语词典抽取;上下文向量;词向量
摘要:
双语词典是一种重要的语言资源,但现有的基于可比语料库的双语词典抽取方法在体系结构、所依赖的基础性资源等方面差异较大,这使得在统一的实验条件下对各种算法进行比较变得很困难.因此,目前的研究工作多选择将性能评测任务限定在很狭小的范围内,缺乏统一的评测结果给双语词典抽取任务的发展和算法的选择带来一定困难.为解决上述问题,选取并实现了四种代表性的双语词典抽取方案,在统一的测试数据集上进行比较研究.在比较研究中,我们重点揭示了词典抽取任务中几种关键因素如语料库大小、训练词典大小等对各算法性能的不同影响程度.本文的结论对今后相关工作中的实验设计、性能比较与算法选用都具有重要的理论意义和实践价值.
语种:
中文
展开
融合梯度信息的改进引导滤波
期刊:
数码影像 ,2016年21(9):1119-1126 ISSN:1006-8961
作者机构:
[谢伟; 周玉钦; 游敏] 华中师范大学计算机学院, 武汉, 430079
关键词:
保边平滑;引导滤波;梯度;光晕;参数自适应
摘要:
目的为了有效消除引导滤波平滑图像后产生的光晕现象,提出一种新型的融合梯度信息的改进引导滤波算法。方法该算法借助引导图像的梯度信息来判断图像边缘位置,并结合指数函数框架设计权值来控制不同图像区域内的平滑倍数,使改进后的引导滤波能够自适应地区分和强调边缘,从而避免边缘附近由于过度模糊所引入的光晕现象。结果与引导滤波算法相比,本文算法能在保边平滑的同时较好地抑制光晕,并在结构相似性(SSIM)评价和峰值信噪比(PSNR)评价中分别取得最高约30%和15%左右的质量提升。结论本文算法具有较好的鲁棒性,在图像平滑、图像细节增强、多曝光图像融合等多种图像处理相关应用中均有着良好的表现。
语种:
中文
展开
基于中心块的多特征自适应图像检索算法
作者:
郭京蕾;李伟;金聪
期刊:
计算机科学 ,2016年43(6):65-67,81 ISSN:1002-137X
作者机构:
[郭京蕾; 李伟; 金聪] 华中师范大学计算机学院, 武汉, 430079
关键词:
背景噪声;中心块;多特征;自适应权重;差分演化
摘要:
为了更好地检索图像内容信息,提出了基于中心块的多特征自适应权重图像检索算法。改进的算法通过检索图像边界区域的主颜色,提取图像背景噪声,从而降低背景噪声对目标物体的干扰。针对多特征权重值设定的难题,提出运用差分演化算法优化特征权值的方法,解决了固定权值分类精确度低的问题。实验结果表明,所提出的算法可有效减少背景噪声的干扰,并在检索准确率和检索效率上均取得了较好的结果。
语种:
中文
展开
Identification of the clustering structure in microbiome data by density clustering on the Manhattan distance
作者:
Jiang, Xingpeng
( 蒋兴鹏 ) ;Hu, Xiaohua;He, Tingting
* ( 何婷婷 )
期刊:
中国科学:信息科学(英文版) ,2016年59(7):070104-1-070104-7 ISSN:1674-733X
作者机构:
[Jiang, Xingpeng; He, Tingting; Hu, Xiaohua] Cent China Normal Univ, Sch Comp Sci, Wuhan 430079, Peoples R China.;[Hu, Xiaohua] Drexel Univ, Coll Comp & Informat, Philadelphia, PA 19104 USA.
通讯机构:
[He, Tingting] C;Cent China Normal Univ, Sch Comp Sci, Wuhan 430079, Peoples R China.
关键词:
microbiome;information distance;data visualization;density clustering;microbial community
摘要:
Clustering technology is a method for grouping data points into clusters containing a group of similar data points. In a real dataset such as microbiome data, the data points are presented as profiles or a probability distribution. These data points form the periphery of a cluster, making it difficult to identify the real clustering structure. In this study, we used density clustering on several distance measures to overcome this difficulty. Experiments using a real dataset indicated that the Manhattan distance is an appropriate distance measure for clustering analysis of microbiome data.
语种:
英文
展开