首页 期刊 计算机工程 基于MapReduce的并行关联规则增量更新算法 【正文】

基于MapReduce的并行关联规则增量更新算法

作者:程广 王晓峰 上海海事大学信息工程学院 上海201306
大数据   云计算   mapreduce编程模型   频繁项集   增量更新  

摘要:为解决传统关联规则挖掘算法在大数据环境下运行效率较低的问题,基于频繁模式增长(FP-growth)算法,提出一种面向大数据的并行关联规则增量更新算法。利用MapReduce编程模型与云计算平台,对FP-growth算法各步骤进行并行化处理。在增量更新挖掘过程中,使用已有的频繁项集和1-项集对新增事务集构建频繁模式树,通过扫描原始事务数据库完成频繁项集的更新。实验结果表明,与传统关联规则挖掘算法相比,该算法具有更高的挖掘效率和扩展性,适用于海量数据的关联规则增量挖掘。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅