gpu论文10篇_发表之家

首页文献资料

一种适用于GPU图像处理算法的合并存储结构

作者：左宪禹; 张哲; 黄祥志; 葛强; 张理涛; 臧文乾期刊：《计算机工程与科学》 2020年第02期

大多数图像处理算法都可利用GPU进行加速以达到更好的执行性能,但数据传输操作与核函数执行之间的调度策略问题仍是桎梏加速性能进一步提升的主要瓶颈。为了解决这个问题,通常采用GPU任务流将核函数执行与数据传输操作进行重叠,以隐藏部分数据传输与核函数执行耗时。但是,由于CUDA编程模型的特性以及GPU硬件资源的限制,在某些情况下,即使创建较多的任务流用于任务重叠,每个流上仍会存在串行执行的任务,导致加速效果无法进一步提升...
基于GPU的最小二乘蒙特卡罗算法期权定价

作者：杜伟; 傅游期刊：《计算机工程与应用》 2020年第04期

期权是以金融产品作为行权品种的交易合约。随着期权交易规模和交易量的迅速增长,期权定价的计算量越来越大,在传统CPU平台上对期权进行定价变得越来越困难。图形处理器(GPU)平台的出现和发展为解决期权定价计算提供了解决方案。在GPU上使用最小二乘蒙特卡罗算法(Least Squares Monte Carlo,LSM)实现了对一维和四维美式期权定价计算:首先利用CURAND库产生大量随机数,然后并行化期权标的价格变化路径,最后对最小二乘法和贴现定价进...
基于CUDA的地震相干体并行算法

作者：张全; 林柏栎; 彭博; 王世元期刊：《地质与勘探》 2020年第01期

相干体技术在地震勘探资料解释方面得到了广泛的应用,由于相干体技术处理的对象是三维地震数据体,所以算法运算时间较长。为了缩短解释周期,本文充分发挥GPU并行计算优势,对C3相干体算法进行并行化分析。从硬盘读取数据到GPU上计算相干值并写入硬盘的整个过程进行分析,剔除了冗余数据的读取,完成了C3相干体算法的并行化设计与实现。最后分别对串行算法与并行算法进行性能测试,结果表明本文设计的并行算法在保证精度的前提下达到了1...
大规模天文数据分析及多维信息可视化平台的建设和管理

作者：杨哲睿; 高娜; 刘梁期刊：《科研信息化技术与应用》 2015年第05期

现代天文学发展迅速,天文数据呈现指数级增长。GPU高性能通用计算架构为完成海量天文数据科学计算和处理提供了有效的途径。紫金山天文台在高速安全的IPv6网络环境的基础上,建设部署了总计算峰值达到350TFlops,总存储量达到288TB的大规模天文数据分析及多维信息可视化平台。该超算集群由1个管理节点、25个计算节点和5个存储节点构成,使用界面友好、统一集中的集群管理软件,部署专有环境控制设置和多维可视化安全管理系统,形成了多...
GPU计算：突破制约计算化学发展的瓶颈

作者：刘松; 鲍建樟; 李长瑜; 于建国期刊：《科研信息化技术与应用》 2014年第02期

在生物体系、材料科学和药物设计等领域,采用计算化学方法存在计算耗时长、计算精度难以提高、计算体系难以扩大等瓶颈问题。本文介绍了使用GPU加速的量子化学计算程序和分子动力学模拟程序的新进展,并着重对完全为GPU计算设计的量子化学计算程序TeraChem和分子动力学模拟程序ACEMD在算法、功能、性能和应用等方面做了详细的介绍,展望了GPU技术在计算化学领域中新的机遇和挑战。
GPU技术在天文学中的应用

作者：彭南博; 张彦霞期刊：《科研信息化技术与应用》 2011年第03期

本文简单介绍了GPU技术的发展历程，并行运算时的工作特点，在具体的研究课题中应用GPU技术时注意的事项及发挥其性能时需要注意的细节问题。我们重点描述了当前在天文学领域的11种GPU应用情况，以及它们取得的显著成果，比如N体模拟、射电干涉仪、地外行星搜寻等。从这么多的应用来看，与GPU相比，GPU可以使得运算速度显著提升1～2个数量级，在地外行星搜索中甚至可以使得加速比达到惊人的600倍。一定条件下，GPU甚至可以与专门针...
基于GPU的超级计算系统在ADS散裂靶设计中的应用

作者：齐记; 田园; 张智磊; 许建亚期刊：《科研信息化技术与应用》 2011年第06期

从长期发展来看，核电作为一种清洁、高效的新型能源，是中国调整能源结构、缓解常规能源供应压力和减少温室气体排放的必然选择。然而，发展核电的安全性问题以及核废料处理问题是当前世界范围内研究的前沿问题。ADS，即加速器驱动的次临界系统，它能够有效嬗变核废料。本文介绍了利用GPU超算平台来实现ADS项目的相关设计模拟工作，目前自行开发的GPU程序在初步的应用中已经达到了较为满意的加速比。
基于通用计算图形处理器的电磁场有限元计算加速方法探讨

作者：徐小宇; 刘国强期刊：《科研信息化技术与应用》 2010年第04期

利用电磁场数值方法计算集成电路互联线寄生参数提取是电子设计自动化中重要的课题,随着电路集成度的增加与特征尺寸的减小,更遇到规模与精度的双重挑战,进行全芯片级的快速提取成为必要。并行计算是最为直接的解决途径,而通用计算图形处理器因其高度线程并发性以及低成本低功耗得到迅速应用。本文基于电磁场有限元计算方法,一方面针对通用图形处理器的特点采用自适应不连续伽辽金有限元法,在提高计算精度的同时不显著提高问题的自...
155项测试证明显卡/CPU这样搭配才合理

作者：Allen（文/图）; 曹斐（文/图）期刊：《新一代信息技术》 2008年第15期

“能领兵者，谓之将也”；“能将将者，谓之帅也”。所谓将才，就是能够独当一面，有冠三军之武勇，统领千军万马剿灭敌人，片甲不留!所谓帅才，则是能够审视大局，运筹帷幄，统领诸将取得战争最后的胜利。而CPU与GPU之间的关系有宛若整个电脑的帅与将，虽然这个理论老早就已经提出，但通过对14块CPU和13块显卡测试出的155项数据的仔细解读，则会让我们在避免攒机误区的同时从新认识这一理论。
明明白白作菜鸟洞穿显存、内存规格

作者：凹凸南瓜; 双鱼期刊：《新一代信息技术》 2008年第08期

显存和内存其实是两兄弟，都属于存储芯片，应用的各种技术都相同，只不过显存是图形存储芯片，它为GPU中的图形数据传输作了专门优化，用在显卡上能够获得更高的性能。这两兄弟看起来简单，实际却有着众多的门门道道，市场上购买产品时一不小心就可能在这上面被JS给忽悠了，下面我们就揭秘显存和内存的各个重要参数。
让普通Android手机玩上Tegra专属游戏

作者：期刊：《新一代信息技术》 2011年第12期

众所周知,Android系统的硬件差别很大。因此有不少游戏开发商就设置了机型限制，让其它很多非专属平台的机器无法运行他们的游戏。这是一直困扰着很多机油的问题。不过现在。Chainfire3D成功解决了这个问题。这很可能是手机上首个实现模拟跨平台GPU驱动的软件。
真GPU植入IntelH55＋PentiumG处理器极速评测

作者：期刊：《新一代信息技术》 2010年第01期

在前两期杂志当中，本刊刊登了《32纳米制程首演揭秘英特尔Ciarkdale处理器性能》一文，对英特尔即将在2010年一月份的一颗整合了GPU的PentiumG6950处理器进行了详细的评测。不过。由于彼时本刊评测室尚未拿到采用H55／H57芯片组的主板，因此未能一试Clarkdale处理器所整合的GPU的实际性能，颇为遗憾。
玩到“透芯凉”!显卡散热器DIY

作者：风.APPLE 期刊：《新一代信息技术》 2008年第10期

说起散热，大部分朋友可能会首先想到CPU散热，其实不然，显卡散热同样重要。如今的显卡核心GPU已经拥有比CPU更多的晶体管数，如新款9800G×2拥有高达7.54亿个晶体管数，峰值功率230W，发热量自然不小。当然，高端显卡并不是市场的主流，但在中低端市场，显卡散热器对显卡所带来的方方面面制约也逐渐暴露出来。因此，一些DIY玩家已经蠢蠢欲动，开始向显卡散热器升级、改造“下手”。
基本图像处理算法的优化分析

作者：尹卓钰期刊：《科学与信息化》 2018年第19期

数字视频图像处理技术已经被广泛地应用到各个领域内,并取得了良好效果。但是就现状来看,以往所应用的基于通用CPU的图像处理系统已经无法完全满足现在所需,还需要在原有基础上来对基本图像处理算法进行优化,以求更好地提高数字图像处理速度。
AI技术的天花板

作者：何宝宏期刊：《信息通信技术与政策》 2018年第04期

AI让智能和意识分离,虽然它一直是无意识的,但其完全有可能会超越人类。用计算机专家Donald Knuth的说法:'AI已经在几乎所有需要思考的领域超越了人类,但是在那些人类和其他动物不需要思考就能完成的事情上,还差得很远。'这一评价将是相当长时间内AI的未来。本文主要介绍了AI的3大支柱、3种背后力量以及AI所面临的技术局限性。
基于异构计算的无人机影像畸变差改正研究

作者：李丽敏; 宋云山期刊：《测绘》 2015年第05期

低空无人机航空摄影是获取灾区影像的最为方便、快捷的手段。影像畸变差改正，是进行无人机影像预处理的重要步骤。本文提出了一种基于C＋＋AMP的并行影像畸变差改正算法，能够提高无人机影像畸变差改正的速度；并通过与基于CPU的串行（并行）影像畸变差改正算法进行对比分析，总结出适用于无人机影像畸变差改正的任务调度策略。
新华三云桌面基于NVIDIA vGPU

作者：期刊：《网络安全和信息化》 2018年第08期

新华三集团推出采用NVIDIA vGPU技术的基于KVM虚拟化平台商用的全新云桌面解决方案，该方案能通过GPU服务器集群实现集中编码、捕获、渲染，降低前端的工作负载，并且提供绝佳的使用体验。
EMC C4140支持新的CPU和GPU

作者：期刊：《网络安全和信息化》 2017年第12期

更新的C4140是1U机架式，最多1．5TBRAM、2个至强SP20核CPU，和之前一样支持4个GPU，可以是Tesla P40、P100和V100s，并且这些GPU是相互连接的。此外这款服务器还有最多2个NVMe附加卡式的闪存驱动器，后部有PCIe插槽，1．6、3．2和6．4TB几个容量选择，支持Mellanox ConnectX-4单端口和双端口EDR适配卡。它采用TeslaV100GPU和4个NVLink的C4140最多可提供62．8TFLOPS单精度性能。
让GPU时刻保持冷静的奥秘

作者：期刊：《网络安全和信息化》 2017年第06期

沈卫东：液冷技术的作用可以归结为五点：有效地节能降耗：降低CPU的工作温度，提升可靠性与计算性能；降低风扇和风道中产生的风噪；进一步提高数据中心的功率密度，减小机房占地面积；降低数据中心设备的投资。目前的液冷技术分为间接冷却和直接冷却，也就是我们正在研究的冷板式液冷和全浸没式液冷技术。我们在冷板式液冷服务器的设计过程中。
NVIDIA GPU Clould 进一步扩展

作者：期刊：《网络安全和信息化》 2018年第01期

NVIDIA宣伽将NVIDIA GPU Clould（NGC）支持扩腱垒NVIDIA TITAN，使数十万采用桌面级GPU的AI研究人员能够利用NGC的强大功能。NVIDIA还公布了NGC的功能扩展，

阅读更多

热门标签

热门期刊