首页 期刊 科研信息化技术与应用 基于CUDA架构的GPU的并行数据挖掘技术研究 【正文】

基于CUDA架构的GPU的并行数据挖掘技术研究

作者:刘莹; 菅立恒; 梁莘燊; 李小君; 高洋; 王琤 中国科学院研究生院信息科学与工程学院; 安捷伦科技有限公司(中国)
并行计算   数据挖掘   图形处理器gpu   cuda   关联规则  

摘要:数据挖掘是从海量数据中挖掘有价值的、新颖的、可理解的知识的技术,目前在很多领域都已有重要的应用。但是,由于计算量很大,已有的数据挖掘软件很难满足应用的实时性需要,多是以后台模式进行处理。因此,人们对并行数据挖掘技术的需求十分强烈。图形处理器(GPU)的最新发展已经能够以低廉的成本提供高性能的通用计算。另外,基于GPU的CUDA编程模型为程序员提供了充足的类似于C语言的API,便于程序员发挥GPU的并行计算能力。本文将介绍GUCAS-CUMiner(在GPU+CPU并行计算平台上实现的数据挖掘算法),包括CU-Apriori、CU-KNN和CU-K-means。GPU承担了各个算法中的计算密集部分,一些优化技术被用来最大化并发程度和带宽。我们在安装了Tesla C1060GPU的HP xw8600工作站上进行了算法的性能测试。实验结果表明,并行算法在人工合成数据和真实应用的数据上都表现出很好的加速性能。本研究结果表明基于CUDA架构的并行数据挖掘是提高数据挖掘技术性能的一个行之有效的途径。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅