首页 期刊 计算机工程与科学 混部数据中心负载特征及其任务调度优化分析 【正文】

混部数据中心负载特征及其任务调度优化分析

作者:王济伟; 葛浙奉; 蒋从锋; 张纪林; 俞俊; 林江彬; 闫龙川; 任祖杰; 万健 杭州电子科技大学计算机学院; 浙江杭州310018; 阿里云计算有限公司; 浙江杭州311121; 国网电力信息通信有限公司; 北京100053; 之江实验室; 浙江杭州311121; 浙江科技学院信息与电子工程学院; 浙江杭州310023
混部数据中心   负载特性   在线服务   批处理作业   调度  

摘要:随着现代互联网数据中心的规模越来越大,数据中心面临着能耗、可靠性、可管理性与可扩展性等方面的挑战。同时,数据中心承载的服务多样,既有在线Web服务,也有离线批处理任务。在线任务要求较低的延迟,而离线任务要求较高的吞吐量。为了提高服务器利用率,降低数据中心能耗,当前数据中心往往将在线任务和离线任务混合部署到同一个计算集群中。在混部场景下,如何同时满足在线和离线任务的不同要求,是目前面临的关键挑战。分析了阿里巴巴于2018年的含有4034台服务器的混部计算集群在8天内的日志数据(cluster-trace-v2018),从静态配置信息、动态混部运行状态、离线批处理作业DAG依赖结构等出发,揭示其负载特征,包括任务倾斜与容器部署的相关关系等,根据任务依赖关系与关键路径,提出了相应的任务调度优化策略。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅