基于位置语言模型的中文信息检索系统的研究
期刊:
计算机科学 ,2015年42(7):265-269 ISSN:1002-137X
作者机构:
[胡小华] 华中师范大学计算机学院 武汉430079;[胡小华] 德雷塞尔大学信息科学与技术学院 费城19082;[何婷婷; 涂新辉; 陈雅兰] 华中师范大学
关键词:
位置语言模型;近邻性;段落检索;传播数
摘要:
在大多数现有的检索模型中常常忽略了如下事实:一个文档中匹配到的查询词项的近邻性和打分时所基于的段落检索也可以被用来促进文档的打分。受此启发,提出了基于位置语言模型的中文信息检索系统,首先通过定义位置传播数的概念,为每个位置单独地建立语言模型;然后通过引入KL-divergence检索模型,并结合位置语言模型给每个位置单独打分;最后由多参数打分策略得到文档的最终得分。实验中还重点比较了基于词表和基于二元两种中文索引方法在位置语言模型中的检索效果。在标准NTCIR5、NTCIR6测试集上的实验结果表明,该检索方法在两种索引方式上都显著改善了中文检索系统的性能,并且优于向量空间模型、BM25概率模型、统计语言模型。
语种:
中文
展开
基于余弦距离的局部敏感哈希的KNN算法在中文文本上的快速分类
作者:
戴上平;冯鹏;刘盛英杰;舒红
期刊:
计算机工程与科学 ,2015年37(10):1971-1976 ISSN:1007-130X
作者机构:
华中师范大学计算机学院;[舒红] 测绘遥感信息工程国家重点实验室;[刘盛英杰; 戴上平; 冯鹏] 华中师范大学
关键词:
文本分类;局部敏感哈希;布尔向量
摘要:
文本分类是文本挖掘中最重要的研究内容之一.为了克服目前以距离衡量的近似分类算法在海量数据下耗费大量时间的缺陷,提出了结合基于余弦距离的局部敏感哈希的方式将KNN算法在TF-IDF下对中文文本进行快速分类.同时结合文本数据的特性给出了不同的哈希函数级联方式分别进行实验.在实验过程采用了布尔向量的方式规避重复访问,使分类的结果在可以允许的范围内,分类速度比原始KNN提高了许多.
语种:
中文
展开
基于GA-PSO的粗糙集属性约简算法
作者:
戴上平;刘素军;郑素菲
期刊:
计算机工程与科学 ,2015年37(2):397-401 ISSN:1007-130X
作者机构:
[戴上平; 刘素军; 郑素菲] 华中师范大学计算机学院
关键词:
粗糙集;属性约简;核
摘要:
属性约简是粗糙集合研究的重要内容之一。为了能够有效地获取决策表中属性最小相对约简,提出了一种基于GA-PSO的属性约简算法。该算法以条件属性对决策属性的支持度为基础,求解核属性,把所有的条件属性(除去核属性)加入粒子群算法的初始种群中,并用遗传算法对不满足适应度条件的粒子进行交叉变异操作。实验结果表明,该算法在加强局部搜索能力的同时保持了该算法全局寻优的特性,能够快速有效地获得最小相对属性集。
语种:
中文
展开
基于高斯混合模型的感知域音频编码方法
作者:
吕亚平;高戈;陈怡;张康
期刊:
计算机工程 ,2015年41(10):265-269 ISSN:1000-3428
作者机构:
[吕亚平; 高戈; 张康] 武汉大学计算机学院;[陈怡] 华中师范大学计算机学院
关键词:
人耳听觉系统;感知域音频编码;高斯混合模型;Gammatone滤波器组;高斯-牛顿算法
摘要:
传统感知音频编码方案采用心理声学掩蔽降低编码码率,其声道模型+信号激励的方式难以同时实现高质量的中低码率语音和音频信号编码。为此,提出一种基于高斯混合模型的感知域音频编码方法,利用Gammatone滤波器组模拟人耳听觉系统,采用多路复用掩蔽模型替换降低包络脉冲的数量,对结构化模型进行拟合,使用高斯-牛顿算法对听觉包络进行高斯混合模型参数的拟合,将高斯混合模型参数替代音频信号特征。实验结果表明,与基于稀疏包络表示重构的音频编码方法相比,该方法的主观测试高0.5分~0.8分,客观测试高5分~10分,解码得到的语音和大部分音乐信号都能还原到原始音频信号,可用于实现高质量的中低码率语音和音频编码。
语种:
中文
展开
基于MapReduce的序列模式挖掘算法
作者:
余啸;马传香;李伟亮;金聪
期刊:
计算机应用研究 ,2015年32(11):3312-3314 ISSN:1001-3695
作者机构:
[余啸; 马传香; 李伟亮] 湖北大学计算机与信息工程学院;[金聪] 华中师范大学计算机科学学院
关键词:
数据挖掘;GSP算法;序列模式;子序列数据库
摘要:
针对传统GSP算法需要多次扫描数据库、I/O开销巨大的缺点,提出了一种基于MapReduce编程框架的序列模式挖掘算法MR-GSP(GSP algorithm based on MapReduce)。MR-GSP算法将原序列数据库划分为多个子序列数据库并分发到多个Map节点,Map函数扫描存放在Map节点内存中的子序列数据库,产生局部序列模式,Reduce函数对所有局部序列模式合并,扫描原序列数据库,计算局部序列模式的支持度,得到最终的序列模式。相比于传统GSP算法,MR-GSP算法只需扫描两次原始数据库即可得到所有序列模式。实验结果表明,MR-GSP算法在对大数据集进行序列模式挖掘时,可充分利用云计算技术的优势,提高挖掘效率。
语种:
中文
展开
基于贝叶斯模型的复句关系词自动识别与规则挖掘
期刊:
计算机科学 ,2015年42(7):291-294+319 ISSN:1002-137X
作者机构:
[杨进才; 郭凯凯; 沈显君; 胡金柱] 华中师范大学计算机学院
关键词:
复句关系词;贝叶斯;规则;自动标识
摘要:
复句是汉语语法的重要实体单位,关系词的自动识别是复句标识的基础,对复句的标识以及篇章的研究有重要意义。在对汉语复句语料库进行广泛分析的基础上,从复句关系词所在的环境和关系词的组合搭配方面进行特征的提取,对提取的特征进行形式化描述。采用互信息和信息增益相结合的方式进行特征选择以及冗余特征的消除;使用贝叶斯模型对特征集合进行训练和测试;将基于统计过程的结果转化为规则,形成规则库,并根据规则进行关系词自动识别。实验结果显示,本方法获得了较高的识别正确率,具有可行性和有效性。
语种:
中文
展开
基于粗约简和网格的离群点检测
作者:
王敬华;金鹏
期刊:
计算机工程与应用 ,2015年51(3):133-137,180 ISSN:1002-8331
作者机构:
[王敬华; 金鹏] 华中师范大学计算机学院
关键词:
数据挖掘;离群点检测;粗糙集;网格;属性权值
摘要:
为解决现有高维海量数据离群点挖掘在时间与空间效率上的不足,提出了一种基于粗约简和网格的离群点检测算法RRGOD。算法在基于密度的离群点检测算法LOF的基础上,结合粗糙集理论特点,引入属性权值概念,淘汰属性权值低于重要度阈值的属性降低维度,从而减少了进行聚类的计算量。在网格聚类阶段,对传统的网格划分方法进行改进,引入属性维半径向量概念,提出了一种可变网格划分方法,根据数据集特点自适应地划分网格空间。在真实数据集和仿真数据集上进行了实验。结果表明,该算法在进行离群点检测时能在保持足够精确度的同时,检测效率有显著的改善。
语种:
中文
展开
基于改进分块颜色特征和二次提取的关键帧提取算法
作者:
刘华咏;李涛
期刊:
计算机科学 ,2015年42(12):307-311 ISSN:1002-137X
作者机构:
[刘华咏; 李涛] 华中师范大学计算机学院
关键词:
关键帧;颜色特征;等面积矩形环;二次提取
摘要:
关键帧提取技术是视频摘要、检索、浏览和理解中的一项重要技术。目前关键帧提取算法存在一些问题,例如特征选择复杂、阈值选择难、自适应性不强等。为了更有效地提取视频关键帧,提出了一种基于改进分块颜色特征和二次提取的关键帧提取算法。首先,对视频帧进行等面积矩形环划分;其次,提取矩形环的HSV量化颜色特征,并由帧图像中心到外依次减小每个矩形环特征的权值以突出图像主体部分;然后,依据相邻视频帧间特征的显著性变化初步选取关键帧;最后,依据初次提取的关键帧在视频中的位置间隔大小进行二次提取优化关键帧。实验结果表明,该方法具有良好的适应性,同时能够有效避免因镜头有突然闪光或物体快速运动而提取过多的关键帧,最终提取的关键帧能够比较全面准确地表达视频内容。
语种:
中文
展开
基于时间属性序列图的监控器构造方法
作者:
叶俊民;辜剑;陈曙;董威;舒绍娴
期刊:
小型微型计算机系统 ,2015年36(7):1426-1431 ISSN:1000-1220
作者机构:
[叶俊民; 辜剑; 陈曙] 华中师范大学计算机学院;[董威; 舒绍娴] 国防科技大学计算机学院
关键词:
时间属性序列图;时间自动机;监控器;运行时验证
摘要:
运行时验证一般采用时态逻辑来描述要验证的需求规约,并根据需求规约构造监控器.这对于那些没有形式化经验的软件工程师而言,是一件非常困难的事情,同时,这类方法通常缺少时间机制支撑,因此难以满足实时系统运行时验证中的要求.序列图得到了广泛使用,研究基于序列图来自动生成监控器就显得十分有意义.提出基于UML2.0时间属性序列图的监控器的自动生成方法,其具体思想是使用时间属性序列图来描述要验证的需求规约,然后将整个序列图转换为时间自动机网络,构造出监控器.实验表明,该方法方便缺少形式化经验的软件工程师使用,所产生的监控器运行开销较小,能满足验证对实时性的要求,且有效缓解了监控器生成过程中的组合爆炸.
语种:
中文
展开
基于程序频谱的动态缺陷定位方法研究
作者:
叶俊民;何印标;陈曙;董威;舒绍娴
期刊:
软件学报 ,2015年26(2):390-412 ISSN:1000-9825
通讯作者:
Chen, Xiang
作者机构:
[叶俊民; 何印标; 陈曙] 华中师范大学计算机学院;[董威; 舒绍娴] 国防科技大学计算机学院
通讯机构:
School of Computer Science and Technology, Nantong University, Nantong, China
关键词:
软件调试;缺陷定位;程序频谱;测试用例;测试用例预言
摘要:
基于程序频谱的动态缺陷定位是软件自动化调试研究中的一个热点问题,通过搜集测试用例的程序频谱和执行结果,基于特定模型以定位缺陷语句在被测程序内的可能位置.对近些年来国内外学者在该研究领域取得的成果进行系统总结:首先,给出预备知识和基本假设;随后,提出缺陷定位研究框架并识别出框架内一系列可影响缺陷定位效果的内在影响因素,包括程序频谱构造方式、测试套件构成和维护、内在缺陷数量、测试用例预言设置、用户反馈和缺陷修复开销等;接着,对实证研究中采用的评测指标和评测程序进行总结和分析;然后,对缺陷定位方法在一些特定测试领域中的应用进行总结;最后,对该领域未来值得关注的研究方向进行了展望.
语种:
中文
展开
基于DNA序列的彩色图像加密算法
作者:
涂正武;金聪
期刊:
计算机工程与科学 ,2015年37(10):1933-1939 ISSN:1007-130X
作者机构:
[涂正武; 金聪] 华中师范大学计算机学院
会议名称:
2015全国理论计算机科学学术年会
会议时间:
2015-10-30
会议地点:
金华
会议论文集名称:
2015全国理论计算机科学学术年会论文集
关键词:
DNA序列;位平面;图像加密;Chen超混沌
摘要:
结合混沌系统和DNA密码学,提出了一种基于DNA序列的彩色图像加密算法。该算法应用了DNA序列的加法、减法、异或运算,并且把彩色图像分解为位平面进行处理。首先对彩色图像位平面分解、DNA编码;然后对DNA平面置乱、DNA加法运算、DNA异或运算;最后进行DNA解码、位平面合并,得到密文图像。实验结果表明,原始图像加密后的图像类似噪声,加密后的直方图变得更平滑,对密钥有很高的敏感性,密文图像的随机性好,密文图像相邻像素之间相关性低。
语种:
中文
展开
基于超图的文本摘要与关键词协同抽取研究
期刊:
中文信息学报 ,2015年29(6):135-140 ISSN:1003-0077
作者机构:
[何婷婷; 莫鹏; 胡珀; 黄湘冀] 华中师范大学计算机学院, 湖北, 武汉, 430079
会议名称:
中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)
会议时间:
2015-11-13
会议地点:
广州
会议论文集名称:
中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)论文集
关键词:
超图;文本摘要;关键词抽取;协同抽取
摘要:
文本摘要和关键词抽取是自然语言处理领域的两个重要研究课题,它们均以生成描述文本主旨内容的精简信息为目标。尽管这两个任务目标相似,但它们通常被作为两个独立的问题分别研究,而较少考虑其彼此间的自然关联性。尽管已有学者提出了基于图模型的协同抽取方法,该方法同时考虑了句子与句子、词与词、句子与词之间的各种关系,以迭代强化的方式同时生成文本摘要和关键词,但现有模型大多仅限于表达句子与词之间的各种二元关系,而忽视了不同文本单元间潜在的若干重要的高阶关系。鉴于此,该文提出了一种新的基于超图的协同抽取方法。该方法以句子作为超边,以词作为节点构建超图,在一个统一的超图模型下同时利用句子与词之间的高阶信息来生成摘要和关键词。在NLPCC 2015面向微博的新闻文本摘要任务数据集上的实验结果验证了所提方法的可行性和有效性。
语种:
中文
展开
基于移动应用层组播终端主动反馈的自适应负载均衡机制研究
作者:
崔建群;江波;吴黎兵
期刊:
计算机科学 ,2015年42(4):40-43,50 ISSN:1002-137X
作者机构:
[崔建群; 江波] 华中师范大学计算机学院;[吴黎兵] 武汉大学计算机学院
会议名称:
2014湖北省计算机学会学术年会
会议时间:
2014-10-31
会议地点:
宜昌
会议论文集名称:
2014湖北省计算机学会学术年会论文集
关键词:
移动终端;主动反馈;自适应;负载均衡
摘要:
在移动应用层组播通信中,热点地区可能会因用户过多而导致用户流服务满意度降低,非热点地区却可能会出现资源浪费现象,引起整个系统性能下降。提出了一种基于移动终端主动反馈的自适应负载均衡机制(Adaptive Load Balancing Mechanism based Mobile Terminal Active Feedback,ALBM-MTAF)。ALBM-MTAF利用网络相关性能指标模拟移动终端(用户)所获得的流媒体服务满意度(Streaming Media Service Satisfaction,SMSS),通过终端用户主动反馈SMSS不断进行自适应的调整,将SMSS较差地域的子节点切换到SMSS较好的父节点上,从而实现整个系统的负载均衡。模拟实验表明,该机制具有良好的负载均衡效果,并能保证通信的质量。
语种:
中文
展开
移动环境下应用层组播的高连续性父子节点交换策略
期刊:
小型微型计算机系统 ,2015年36(10):2279-2283 ISSN:1000-1220
作者机构:
[崔建群; 黄枫; 张文琳] 华中师范大学计算机学院;[吴黎兵] 武汉大学计算机学院
关键词:
移动环境;应用层组播;高连续性;交换策略;终端延迟
摘要:
移动环境下的应用层组播网络模型构建是继非移动环境下组播模型构建的研究热点,缩短组播接收转发延迟和组播树网络模型结构调整策略是其中要解决的关键问题.提出一种基于小规模的移动环境下的高连续性父子节点交换策略.该策略基于传统构建的组播树,通过周期检测节点参数,在尽量减少断开数据传送连接的前提下,进行父子节点交换,力求获得更好的组播树拓扑和性能.仿真实验数据表明,高连续性的快速父子节点交换策略在移动环境下具有良好的性能,在组播接收转发延迟和组播树模型的平均出度上都有较大的优越性.
语种:
中文
展开
复句关系词规则生成系统中的冲突检测与处理
期刊:
中文信息学报 ,2015年29(4):8-15 ISSN:1003-0077
作者机构:
华中师范大学计算机学院,湖北武汉,430079;湖北工业大学计算机学院,湖北武汉,430068;[杨进才; 胡金柱; 王中华] 华中师范大学;[谢芳] 湖北工业大学
关键词:
复句关系词;规则冲突;有向无环图
摘要:
复句中的关系词对研究复句中各分句的语义关系有着重要意义,在基于规则的关系词自动识别中需要大量的规则,并且规则库是动态变化和不断完善的,向规则库中入库规则时会出现规则冲突和入库错误的情况,该文探讨如何在入库时识别产生冲突的规则,并对规则进行相关的处理。对复句的普通规则、连用词规则、普通句式规则、连用句式规则四类规则进行了形式化的表示与存储,在此基础上设计了关系词检测、约束类型检测、约束条件检测、结论检测的检测流程。提出了两种冲突处理方式——优先级方式和有向无环图方式,对两种方法进行了比较。利用该检测方法和有向无环图的处理方式,入库了千余条规则。实验表明,利用该方法冲突规则的检测和处理正确率达到100%。
语种:
中文
展开
基于情感从属和最大熵模型的细粒度观点挖掘
作者:
马长林;谢罗迪;司琪;王梦
期刊:
计算机工程与科学 ,2015年37(10):1952-1958 ISSN:1007-130X
作者机构:
[马长林; 谢罗迪; 司琪; 王梦] 华中师范大学计算机学院
关键词:
LDA模型;细粒度观点挖掘;最大熵;情感从属
摘要:
目前许多观点挖掘方法挖掘粒度过大,导致反馈信息不足。为解决该问题,对标准LDA模型进行改进,提出主题情感联合最大熵LDA模型进行细粒度观点挖掘。首先,考虑到词的位置和语义信息,在传统LDA模型中加入最大熵组件来区分背景词、特征词和观点词,并对特征词和观点词进行局部和全局的划分;其次,在主题层和单词层之间加入情感层,实现词语级别的细粒度情感分析,并引入情感转移变量来处理情感从属关系,同时获取整篇评论和每个主题的情感极性,实验验证了所提模型和理论的有效性。
语种:
中文
展开
基于延时影响因子的应用层多播ASD模型改进研究
期刊:
计算机工程与科学 ,2015年37(10):1836-1842 ISSN:1007-130X
作者机构:
华中师范大学计算机学院,湖北武汉,430079;武汉大学计算机学院,湖北武汉,430072;[崔建群; 王博伦; 熊涛] 华中师范大学;[吴黎兵] 武汉大学
关键词:
应用层多播;延时因子;自主选择;高分发度
摘要:
为提高应用层多播的稳定性和效率,在原ASD-TS模型上加以改进,提出一种基于延时因子的ASD-DIF模型。该模型可以在新节点探测整个多播网络的基础上自主选择加入方式,使新节点给整个多播组带来的延时最小,构建高效率、高分发度的多播树。仿真实验表明ASD-DIF模型在构建多播网络的时候能够构建高效率的转发路径,有效降低多播的时延。
语种:
中文
展开
基于域感知多域分簇拓扑感知应用层组播算法
期刊:
华中科技大学学报(自然科学版) ,2015年43(5):1-5 ISSN:1671-4512
作者机构:
[崔建群; 马亮; 黄枫] School of Computer, Central China Normal University, Wuhan;430079, China;[Shan, Zhiguang] Informatization Research Department, State Information Center, Beijing;100045, China;[崔建群; 马亮; 黄枫] 430079, China
会议名称:
第二十届全国网络与数据通信学术会议
会议时间:
2014-11-01
会议地点:
武汉
会议论文集名称:
第二十届全国网络与数据通信学术会议论文集
关键词:
多域分簇;拓扑感知;稳定性;Mul-Dom CTA模型;就近传输;重定向;聚簇能力
摘要:
为提高应用层组播生成树的稳定性和效率,提出了一种基于域感知的多域分簇拓扑感知应用层组播算法(Mul‐Dom CTA).Mul‐Dom CTA算法不仅能够通过链路的传输时延将相近的节点组织在一个拓扑域中,实现数据包的就近传输,而且能够通过节点度约束进行重定向,缓解加入顺序的差异对组播树的不利影响,构建相对稳定的组播树.仿真实验证明Mul‐Dom CTA模型具有良好的聚簇能力,能够有效降低组播树深度,同时降低组播树数据包的传输时延.
语种:
中文
展开
基于设施的移动应用层组播系统构建研究
作者:
崔建群
( 崔建群 ) ;叶咏佳;高宽;范静;吴黎兵
期刊:
小型微型计算机系统 ,2015年36(1):13-16 ISSN:1000-1220
作者机构:
[崔建群; 叶咏佳; 高宽] 华中师范大学计算机学院;[范静; 吴黎兵] 武汉大学计算机学院
关键词:
移动环境;应用层组播;NICE协议;OVERSIM框架
摘要:
针对当前移动网络下组播系统的构建方案进行了相关分析,提出一种基于设施的移动应用层组播系统的构建方案.该方案结合NICE协议的思想完成组播树的构建及其维护工作,同时为了保证所提出的构建方案具有较好的稳定性,本文还对NICE协议进行了相关的改进.根据文中所提出的算法,在组播节点出现故障时能够进行快速的故障恢复,从而弥补移动网络下组播节点高度动态性的缺点.最后在OVERSIM框架下模拟移动环境并在此基础下进行仿真实验.实验结果证明了本文所提出的组播系统组播树的构建方案具有可行性.
语种:
中文
展开
于非局部均值滤波与神经网络的红外焦平面阵列非均匀性校正算法
作者:
张菲菲;王文龙;马国锐;谢伟
( 谢伟 ) ;陈王丽;...
期刊:
红外技术 ,2015年37(4):265-271 ISSN:1001-8891
作者机构:
武汉市测绘院, 湖北武汉;华中师范大学计算机学院, 湖北 武汉;武汉大学测绘遥感信息工程国家重点实验室, 湖北 武汉;[谢伟] 华中师范大学计算机学院, 湖北 武汉 ;[马国锐; 张菲菲; 陈王丽; 秦前清] 武汉大学测绘遥感信息工程国家重点实验室, 湖北 武汉
关键词:
非均匀性校正;神经网络;非局部均值滤波;收敛速度;鬼影
摘要:
深入剖析传统神经网络非均匀性校正方法收敛速度慢以及易产生“鬼影”现象的主要原因,在此基础上,提出一种基于非局部均值滤波和神经网络的红外焦平面阵列非均匀性校正算法。为了加快收敛速度并减少“鬼影”现象,在神经网络隐含层,利用具有全局寻优且能保持边缘的非局部均值滤波器代替传统的均值滤波器以估计具有更高置信度的真值影像;同时设计可变学习率来自适应地调整每个探测元的非均匀性校正参数的迭代更新过程,以进一步消除“鬼影”。采用两组分别受高空间频率和低空间频率非均匀性干扰的真实红外序列图像进行实验。实验结果表明:相较于目前已有的方法,本文方法不仅具有较快的收敛速度,而且较大程度上抑制了“鬼影”现象的发生。
语种:
中文
展开