版权说明 操作指南
首页 > 成果 > 详情

基于Hadoop的多维关联规则挖掘算法研究及应用

认领
导出
Link by 万方学术期刊
反馈
分享
QQ微信 微博
成果类型:
期刊论文
论文标题(英文):
Research and application of a multidimensional association rules mining algorithm based on Hadoop
作者:
杨青;张亚文;张琴;袁佩玲
作者机构:
华中师范大学计算机学院,湖北 武汉 430079
人工智能与智慧学习湖北省重点实验室,湖北 武汉 430079
国家语言资源监测与研究网络媒体中心,湖北 武汉 430079
[张琴; 袁佩玲; 张亚文; 杨青] 华中师范大学
语种:
中文
关键词:
Apriori算法;多维关联规则;并行化
关键词(英文):
Hadoop
期刊:
计算机工程与科学
ISSN:
1007-130X
年:
2019
卷:
41
期:
12
页码:
2127-2133
基金类别:
国家自然科学基金(61532008) 国家重点研发计划(2017YFC0909502).
机构署名:
本校为第一机构
院系归属:
计算机学院
摘要:
传统的Apriori算法要多次扫描数据集,随着数据量的快速增长,传统的Apriori算法已经不能很好地适用于大数据分析,针对该情况设计了IPApriori算法。首先通过剪枝策略设计了一种适用于多维数据的IApriori算法,再将IApriori算法与Hadoop分布式框架相结合,实现了多维关联规则挖掘算法的并行化。将IPApriori算法运用到手机用户行为预测关联分析中,分析影响手机用户行为的一些主要因素,挖掘出手机用户行为与年龄维度、性别维度、时间维度、地点维度和手机品牌维度属性之间可能存在的某种关联。最后通过实验证明,算法的并行化和建立结构的方法可以降低系统的I/O负荷,提高算法的执行效率。
摘要(英文):
The traditional Apriori algorithm has to scan the data set multiple times.With the rapid growth of data volume,it cannot be applied to big data analysis.For this problem,an improved parallel Apriori algorithm is designed.Firstly,an IApriori algorithm for multidimensional data is designed by pruning strategy.Secondly,the IApriori algorithm is combined with the Hadoop distributed framework to realize the parallelization of multidimensional association rules mining algorithm.This paper applies the IPApriori algorithm to the correlation analysis of mobile phone user behavior prediction,analyzes so...

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com