【免费】基于Intel平台的Winograd快速卷积算法研究与优化-发表之家

基于Intel平台的Winograd快速卷积算法研究与优化

作者：武铮; 安虹; 金旭; 迟孟贤; 吕国锋; 文可; 周鑫中国科学技术大学; 合肥230022

winograd 深度学习深度神经网络卷积神经网络向量化

摘要：随着深度学习的快速发展,其在语音处理、图像识别和自然语言理解等领域被广泛应用,为科研产业以及日常生活带去了巨大的变革.Intel紧跟深度学习的浪潮,推出了第2代Xeon Phi处理器KNL(knights landing),其后又了第3代Xeon Phi处理器KNM(knights mill),为深度学习的蓬勃发展带去了新的活力.通过在Intel平台上进行快速卷积算法Winograd的研究与优化,对比IntelMKL(math kernel library)DNN(deep neural network)中的卷积性能,推动Intel MKL DNN中深度神经网络接口的完善以及Intel平台上深度学习的发展.研究中结合Intel最新深度学习平台的AVX-512指令集、高速内存MCDRAM、多MemorySNC模式、二维网格状内核结构等特性,并通过对内存分配、数据调度等情况的分析,设计优化Winograd算法,一方面选取典型的卷积神经网络(convolutional neural network,CNN)网络模型VGG19,测试对比Intel MKL DNN的卷积实现,最终取得了2倍多的性能加速比;另一方面,通过测试常用卷积类型,对比Intel MKL DNN和NVIDIA cuDNN,验证了实现的Winograd对于常用卷积类型具有很好的适用性且具有实际使用价值.该研究工作期望为Intel平台在深度学习领域的发展提供重要的指导意义.

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询免费咨询杂志订阅

热门期刊服务

统计与经济科技与经济计算机教育计算机技术与发展计算机工程与设计计算机与信息技术数值计算与计算机应用科技与经济画报计算机与生活工业审计与会计机械设计与制造会计与经济研究

基于大概念的语文教学基于智慧课堂的教与学基于核心素养的培养基于核心素养的教学方式基于模型的优化设计

计算机研究与发展

影响因子：2.65

期刊级别：北大期刊

发行周期：月刊

服务介绍

基于Intel平台的Winograd快速卷积算法研究与优化

计算机研究与发展

期刊咨询

订阅杂志

期刊推荐