首页 期刊 科学技术与工程 开放式计算语言加速的分段前缀和并行算法 【正文】

开放式计算语言加速的分段前缀和并行算法

作者:肖汉; 李彩林; 郭宝云; 周清雷 郑州师范学院信息科学与技术学院; 郑州450044; 山东理工大学建筑工程学院; 淄博255000; 郑州大学信息工程学院; 郑州450001
分段式前缀和   图形处理器   开放式计算语言   并行算法   性能优化  

摘要:针对数值计算中前缀和运算数据量大、耗时巨大这一难题,提出了一种基于开放式计算语言(open computing language,OpenCL)的分段式前缀和并行算法。首先进行了分段式前缀和算法的并行性分析,对任务进行了层次化分解与组合,设计了两级并行的分段式前缀和算法;然后通过OpenCL编程将前缀和并行算法映射到CPU+GPU系统平台上,实现了层次化并行前缀和处理;最后,根据计算单元(compute unit,CU)的资源条件,增加CU中本地存储器的分配,通过改进工作节点的访问模式来降低bank冲突,提高访存速度。实验结果表明,与基于AMD Opteron 2439 SE CPU的串行算法、基于OpenMP(open multi-processing)并行算法和基于统一计算设备架构并行算法性能相比,前缀和并行算法在OpenCL架构下NVIDIA Tesla C2075计算平台上分别获得了33.51倍、6.26倍和2.41倍的加速比。验证了提出的并行优化方法的有效性和性能可移植性。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅