摘要:近年来,很多研究者致力于开发自动的性能诊断工具来应对大规模高负荷的分布式环境。云操作系统是云用户与云资源的中间层,诊断并解决云操作系统响应过慢的问题有助于优化云计算系统的性能,在大规模且复杂的分布式云计算环境下,分析云操作系统的任务执行性能具有挑战性。在此背景下,文中提出了一种基于日志的云操作系统性能诊断方法,目的是为指定类别的云操作系统任务找到其处理过慢的原因,为性能优化提供线索。该方法结合云操作系统的实现原理,从云操作系统所产生的海量日志中分离和提取每个系统执行任务相关的日志,抽取关键信息,从而构建层次化的性能描述模型,并将分析粒度逐层细化到函数执行的粒度。通过这种方法,能够找到系统任务执行过慢的主要因素,辅助定位引发性能异常的根源,无需修改源代码或借助源代码分析。以云操作系统OpenStack为原型系统,搭建云计算环境,并进行大规模并发模拟实验。实验结果表明,文中所提出的诊断方法能为系统性能优化提供有效线索,显著提高系统性能,例如,云资源调度过程的耗时可以从分钟级减少到秒级。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社