NVIDIA(辉达)今日正式发布最新NVIDIA CUDA 5平行运算平台。这个全球最普及的平行运算平台,以及专为运用绘图处理器运算加速科学和研发应用程式编程模式带来强劲效能的最新版本现已在NVIDIA开发者专区网站供免费下载。CUDA 已有越过150万下载次数,并可支援180种以上先进的研发、科学和商业应用软体,为开发人员提供了一个最容易运用GPU加速运算优点的方法。

CUDA已成功获得广泛的用户和应用基础,而CUDA 5全新的编程功能可让众多运用GPU加速应用之开发比从前更快、更容易,其中有支持动态平行运算(dynamic parallelism)、GPU指令(GPU-callable)函式库、DRMA(远端直接记忆体存取)的GPUDirect支援,以及NVIDIA Nsight Eclipse Edition的整合式开发环境。

CUDA 5大受开发者青睐
已对CUDA 5预览版作评估的软体开发商都指出,CUDA 5可大幅加速应用程式的运算效能,并提供更好的可编程能力。

国防与航太产业深深了解CUDA GPU加速带给影像、影音和雷达等感测器资料处理作业的好处。来自美国夏洛茨维尔的GE Intelligent Platforms的GPGPU应用工程师Dustin Franklin表示:「CUDA 5 对我们来说是一项非常重大的技术。许多我们正在使用的应用程式都需要直接用GPU运算串流式的感测器资料,而且延迟率要低;因此,新的Kepler GPU 针对RDMA提供GPUDirect支援,这对我们的客户而言十分重要。我们已针对我们客製化的感测器整合了许多支援功能,而且也对成果感到非常满意。」

法国里昂大学医院一位生物化学研究员Guillaume Belz已在複杂的讯号分析和资料开採方面运用动态平行运算和GPU指令函式库。Belz指出:「以往我们的系统只用CPU,所以资料分析工作都要花上数週,甚至是几个月的时间。现在藉由GPU加速功能,我们可以在几小时内就可以得出分析结果。如果没有GPU加速功能,资料分析不可能像现在那幺快。」

在纽约罗彻斯特理工学院攻读成影科学学位的Weihua (Wayne) Sun博士对NVIDIA Nsight Eclipse Edition所作的分析结果极为讚赏。Weihua Sun博士表示:「当我知道CUDA 5会包括全新的Nsight Eclipse Edition整合式开发环境时,我就知道我马上需要一套。一个单一的整合式开发环境具备了所有我需要的编程、除错和最佳化开发工具,必可协助我大幅提升研究工作的生产力。」

CUDA 5的全新功能

CUDA 5可让开发人员尽情运用NVIDIA GPU的效能优势,其中包括以NVIDIA Kepler运算架构打造的GPU加速器。Kepler架构是有史以来最快、最有效率,以及可提供最高效能的运算架构。CUDA 5主要功能包括:

•动态平行运算-为GPU加速功能注入全新的演算法

GPU执行绪可以灵活地大量产生全新的执行绪,让该GPU可针对资料进行运算。动态平行运算可将与CPU之间资料传输次数降到最少,因而可大幅简化平行运算的编程作业。同时,这项功能可让GPU加速功能适用于更多的热门演算法,例如那些适用于自动适应网格精緻化(adaptive mesh refinement)和运算型液态动力学(computational fluid dynamics)等应用软体。

•GPU指令函式库-促成第三方厂商之供应体系

一个全新的CUDA BLAS函式库可让开发人员为他们自己的GPU指令函式库进行动态平行运算。他们可以设计外挂的API,这可让其他开发人员延伸其软体核心(kernel)的功能,并可让其他开发人员在GPU上建置回传函数指标,以便将第三方提供的GPU指令函式库功能进行客製化。而「物件连结」(object linking)功能则可让开发人员将多个CUDA原始档编译到单独的物件档案中,并将它们连结至更大型的应用或函式库,为开发大型GPU应用提供一个有效且熟悉的程序,

•RDMA的GPUDirect支援-将系统的记忆体瓶颈降到最低

GPUDirect可促进GPU与其他PCI-E元件进行直接沟通,同时可支援网路介面卡和GPU之间的直接记忆体存取。这项功能更可在一个丛集中大幅减少GPU节点之间的MPISendRecv延迟问题,而且可提升应用程式的整体效能。

•NVIDIA Nsight Eclipse Edition-可快速、简易地产出CUDA原始码

这项功能可让程式设计人员在Linux和Mac OSX平台上,用熟悉的Eclipse整合式开发环境进行开发、除错,以及为GPU应用程式建立设定档。一个整合式的CUDA编辑器和各种CUDA範例有助加速CUDA原始码之产生,而自动程式码重构(code refactoring)可让CPU loop汇入CUDA核心的过程变得容易。一个整合式的专家分析系统提供自动化的效能分析,并有修正各种原始码效能瓶颈的按步就班式指引,而且语法高亮度显示(syntax highlighting)功能可轻易区分GPU原始码和CPU原始码。

你会喜欢下面的文章? You'll like the following article.