首页 期刊 计算机研究与发展 基于“采集—预测—迁移—反馈”机制的主动容错技术 【正文】

基于“采集—预测—迁移—反馈”机制的主动容错技术

作者:杨洪章; 杨雅辉; 屠要峰; 孙广宇; 吴中海 北京大学软件与微电子学院; 北京102600; 中兴通讯股份有限公司; 广东深圳518057; 北京大学信息科学技术学院; 北京100871
硬盘故障   存储可靠性   容错   人工智能   运维  

摘要:硬盘故障是数据中心最主要的故障,严重影响了可靠性.传统的数据容错技术一般都是通过增加数据冗余来实现的,存在缺陷.主动容错技术通过预测硬盘故障提前将数据迁移,成为研究热点.现有技术大多研究硬盘故障预测,缺乏采集、迁移、反馈的研究,难以商用.提出“采集—预测—迁移—反馈”全流程主动容错机制,包括:分时硬盘信息采集方法、滑动窗口记录合并及样本构建方法、多类型硬盘故障预测方法、多盘联合数据迁移方法、预测结果二级验证及快速反馈方法.测试表明:采集硬盘信息对业务影响仅0.96%,硬盘故障预测召回率达94.66%,数据修复时间较传统方法减少55.10%.该工作已在中兴通讯的数据中心稳定商用,满足了主动容错技术在高可靠、高智能、低干扰、低成本、广适用等核心目标.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅