首页 期刊 计算机应用研究 基于MapReduce的top-k高效用模式挖掘算法 【正文】

基于MapReduce的top-k高效用模式挖掘算法

作者:吴倩; 王林平; 罗相洲; 崔建群; 王海 华中师范大学计算机学院; 武汉430079; 华中师范大学科技处; 武汉430079
数据挖掘   高效用模式   mapreduce   并行算法  

摘要:高效用模式挖掘被广泛地应用于数据挖掘领域。为了挖掘指定数量的高效用模式,一些基于树结构和效用表结构的top-k高效用挖掘算法被提出,但前者在挖掘过程中产生了大量候选模式,后者在效用模式增长时需要进行多次比较;同时,由于在信息社会,数据量呈爆炸性增长,所以在数据集过大的情况下,挖掘高效用模式需以大量存储空间以及计算开销为代价。为了解决这两个问题,基于MapReduce的top—k高效用模式挖掘算法(TKHUP_MaR)被提出。该算法通过两次扫描数据库,利用三次MapReduce来实现并行top—k高效用模式的挖掘。通过实验表明TKHUP_MaR算法在并行挖掘top—k高效用模式的过程中是有效的。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅