减少编程工作、更多地关注科学本身
全球视觉计算技术行业领袖NVIDIA®(英伟达™)今日发布了全新OpenACC工具套件,通过这款全新的套件,未来科学研究将可以做更多事情,并大幅提升计算效率。
虽然计算核心在短时间内不会变得更快,但处理器的并行计算能力则越来越强大。这一趋势在过去的十年里一直存在,而且还会持续下去。
OpenACC现已在HPC行业中得到广泛支持,因为它能够简化GPU等现代处理器的并行编程。自2011年Cray、PGI以及NVIDIA等领先的HPC供应商推出OpenACC编程标准以来,如今已有8000多名研究人员和科学家采用了这一标准。
为了让更多的研究人员享受到这一好处,NVIDIA宣布推出全新的OpenACC工具套件,它是一套免费的多合一OpenACC并行编程工具。
学术界免费使用
此次发布的OpenACC工具套件将让用户更快地实现OpenACC入门。如果你是一名研究人员,那么它几乎可以提供你所需的一切,让你能够快速而轻松地对GPU进行编程。
全新的OpenACC工具套件包含行业领先、用于Linux系统的PGI加速器Fortran/C语言工作站编译器套装软件,该软件支持OpenACC 2.0标准。NVIDIA将在该工具套件中首次向学术开发者和研究人员免费提供这一编译器,同时商业用户可通过注册获得90天免费试用版。
全新的OpenACC工具套件还包括NVProf Profiler工具,它可指导用户在哪里添加 OpenACC“指令”或简单的编译器提示,以加速代码。另外它还包含真实的代码实例来帮助用户快速入门。
一次编程、多平台运行
这些简单的指令不仅仅让研究人员能够享受到加速计算的好处,同时还不会破坏现有的CPU代码,不会浪费之前所有代码编写所花费的时间。
OpenACC的一大主要特性是高性能移植,而PGI OpenACC编译器则把这一优势推向全新高度。该编译器首次能够在x86多核CPU和GPU上加速OpenACC代码。
因此,当你没有一台配备GPU的系统时,该编译器会在多个x86 CPU核心上完成代码并行化以便提升性能。当系统中有GPU时,该编译器将会针对GPU做代码并行化的优化,最终与多核CPU相比可带来5~10倍的性能提升。
不到100行代码带来12倍速度提升
Janus Juul Eriksen是丹麦奥胡斯大学qLEAP中心的一位理论化学博士后,他发表了一篇关于OpenACC的应用案例。在该案例中,他提到了一款名为LS-DALTON的应用,该应用主要用于复杂的大规模分子模拟。
他想要在基于GPU打造的Titan超级计算机上,利用LS-DALTON来模拟更大的科学难题。然而像许多研究人员一样,Eriksen的Fortran编程技能是自学的,他并没有在计算机科学这方面接受过正规教育。
但是借助OpenACC,他只用了短短数日、修改了不到100行代码便使LS-DALTON中的关键算法比CPU版本快了12倍。而且他不需要更改应用中的任何算法即可在一台全球顶级的超级计算机上运行这一应用。
如果你有一款C语言或Fortran应用并且想要使其在配备GPU的计算机系统上运行,那么现在正是时候。
OpenACC工具套件下载:http://www.gpuworld.cn/article/show/471.html