首页 期刊 计算机研究与发展 面向时间序列大数据海量并行贝叶斯因子化分析方法 【正文】

面向时间序列大数据海量并行贝叶斯因子化分析方法

作者:高腾飞; 刘勇琰; 汤云波; 张垒; 陈丹 武汉大学计算机学院; 武汉430072
贝叶斯模型   时间序列大数据   张量分解   海量并行计算   统一计算设备架构  

摘要:时间序列大数据记录着复杂系统在时间和空间上大尺度的演化过程,详细描述了系统不同部分之间的相互作用和相互联系.提取时间序列大数据中潜在的低维因子对研究复杂系统的整体机制有着至关重要的作用.大数据的超高维和大尺度导致许多传统因子分析方法难以适应,先验知识缺乏更增加了研究难度.针对这一巨大挑战,提出了一种面向时间序列大数据的海量并行贝叶斯因子化分析方法(the massively parallel Bayesian factorization approach, G -BF).在缺失先验知识的情况下,通过贝叶斯算法导出因子矩阵,将算法映射至CUDA(compute unified device architecture)模型,以大规模并行的方式更新因子矩阵.该方法支持对任意维度张量的因子分解.实验结果表明:1)与通过GPU加速化的因子分解算法G -HALS(GPU-hierarchical alternative least square)相比,G -BF具有更好的运行性能,且随着数据规模的增加,其性能优越性更加明显;2)G -BF在数据处理规模、秩及维度方面都具有良好的可扩展性;3)将G -BF应用于现有子因子融合框架(hierarchical-parallel factor analysis, H-PARAFAC),可将“巨型”张量作为一个整体进行因子化分解(在2个节点上处理10 11 个数据元素),其能力较常规方法高出2个数量级.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅