首页 期刊 科研信息化技术与应用 不同层次MPI并行程序容错的比较 【正文】

不同层次MPI并行程序容错的比较

作者:赵毅; 曹宗雁; 朱鹏; 迟学斌 中国科学院计算机网络信息中心; 北京100190
mpi   容错   检查点设置   回卷恢复  

摘要:随着超级计算机系统规模的不断扩大和系统结构的日益复杂,系统容错已经成为大规模超级计算机系统必须解决的一个关键问题。MPI并行程序的容错也日益受到关注,其中检查点设置和回卷恢复是MPI并行程序容错中一种重要的容错技术。本文对MPI标准、各种版本MPI实现的容错情况及检查点设置/回卷恢复的容错技术进行了介绍,给出了深腾7000t不同层次MPI并行程序的容错实例和性能测试结果,最后对不同层次MPI并行程序容错的开销进行了分析比较。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅