linux gpu 编程_gpu编程_多gpu编程 - 腾讯云开发者社区

您找到你想要的搜索结果了吗？

是的

没有找到

显卡，显卡驱动,nvcc, cuda driver,cudatoolkit,cudnn到底是什么？

GPU功耗管理方式介绍(Linux)

Management PCI-Express Runtime D3 (RTD3) Power Management是一种用于管理PCI-Express设备的低功耗模式的技术RTD3是一种睡眠状态，当PCI-Express设备处于空闲状态时，可以将其置于低功耗模式，以减少能源消耗和热量产生。英伟达™（NVIDIA®）图形处理器有许多省电机制。其中一些机制会降低芯片不同部分的时钟和电压，在某些情况下还会完全关闭芯片部分的时钟或电源，但不会影响功能或继续运行，只是速度较慢。然而，英伟达™（NVIDIA®）GPU 的最低能耗状态需要关闭整个芯片的电源，通常是通过调用 ACPI 来实现。这显然会影响功能。在关机状态下，GPU 无法运行任何功能。必须注意的是，只有在 GPU 上没有运行任何工作负载的情况下才能进入这种状态，而且在试图开始工作或进行任何内存映射 I/O (MMIO) 访问之前，必须先重新开启 GPU 并恢复任何必要的状态。

NVIDIA发布全新OpenACC工具套件

减少编程工作、更多地关注科学本身全球视觉计算技术行业领袖NVIDIA®（英伟达™）今日发布了全新OpenACC工具套件，通过这款全新的套件，未来科学研究将可以做更多事情，并大幅提升计算效率。虽然计算核心在短时间内不会变得更快，但处理器的并行计算能力则越来越强大。这一趋势在过去的十年里一直存在，而且还会持续下去。 OpenACC现已在HPC行业中得到广泛支持，因为它能够简化GPU等现代处理器的并行编程。自2011年Cray、PGI以及NVIDIA等领先的HPC供应商推出OpenACC编程标准以来，如今已有

AI 技术讲座精选：技术前沿——CUDAnative.jl 支持 GPU 原生编程

【AI100 导读】首款拥有 GPU 原生编程功能的 Julia 编程语言公测版终于发布了！本文介绍了如何编写像 GPU 一样的并行加速程序。经过两年缓慢但却稳定的发展，我们最终发布了首款拥有 GPU 原生编程功能的 Julia 编程语言的公测版。虽然仍然存在某些方面的限制，但是现在运用 Julia 编写 CUDA 核心程序已经得以实现。相应地，使用 Julia 高级语言特性编写高性能的 GPU 代码也成为可能。本篇文章中演示的编程支持是由低级构块组成的，而这些构块与 CUDA C 语言处于相同的抽

010

优秀的深度学习从业者都有哪些优秀的习惯

这是一篇总结文，说说优秀的深度学习从业者拥有的一些习惯，从看论文到写代码，从刷论坛到刷比赛。

美国为何封杀中国超算！一文读懂超级计算机的应用、架构和软件知识

2019年5月，美国商务部将华为列入了出口管制的“实体清单”，华为被推向了这波中美对抗的风口浪尖。紧随其后，6月，特朗普政府又对其他几家中国机构实行了限制出口政策，包括中科曙光、江南计算技术研究所、成都海光等。其中，中科曙光和江南计算技术研究所均为中国超级计算机研发机构，中科曙光研发了“曙光”系列，江南计算技术研究所研发了“神威”系列。另外一个国产超算巨头“天河”相关单位早在2015年就被纳入了实体清单。至此，国产超算三巨头“天河”、“曙光”和“神威”均已被特朗普政府封杀。继“华为禁令”之后，“超算禁令”再次暴露美国欲限制中国发展的野心。那何为“超算”？本文将简述超级计算机的背景知识与发展现状。

CodeXL编程分析工具

要想在异构计算上有所突破，良好的支持环境是必不可少的，NVIDIA就为其GPU通用计算开发了一套CUDA软件，AMD也要有相应的工具才行。这个工具就是CodeXL。 CodeXL 工具套件为软件开发者和独立软件供应商（ISV）进入一个并行编程的新时代奠定基础，以发挥各种计算系统中AMD高性能CPU、GPU和APU的计算性能。CodeXL包含的新特性让开发者可以发掘AMD处理器的最大性能。包括GPU debugger（GPU调试器）、CPU profiler（CPU分析器）、GPU profi

014

用Rust编写的Linux内核GPU驱动程序，或将到来

外媒 Phoronix 报道，Asahi Linix 的核心开发者 Asahi Lina 正在探索用 Rust 编程语言编写该 DRM 内核 GPU 驱动程序的可行性。

CUDA installation

CUDA / Compute Unified Device Architecture / CUDA Toolkit / 工具包

配置深度学习主机与环境（TensorFlow+1080Ti） | 第三章 CUDA与CUDNN安装

01 概念介绍 CUDA（Compute Unified Device Architecture 统一计算设备架构） CUDA(Compute Unified Device Architecture)，是英伟达公司推出的一种基于新的并行编程模型和指令集架构的通用计算架构，它能利用英伟达GPU的并行计算引擎，比CPU更高效的解决许多复杂计算任务。使用CUDA的好处就是透明。根据摩尔定律GPU的晶体管数量不断增多，硬件结构必然是不断的在发展变化，没有必要每次都为不同的硬件结构重新编码，而CUDA就是提供了一

异构计算系列文章（一）：定义、场景及局限性

2020 开年，ZILLIZ 与 InfoQ 筹备了以异构计算为专题的一系列文章。此篇文章作为异构计算专题的开篇，整体性的介绍了异构计算的定义、场景与局限性。在后续的专题文章中，我们将深入不同的 AI 应用场景进一步解释异构计算的优势。

CUDA-GDB安装+环境配置

在GPU上开发大规模并行应用程序时，需要一个调试器，GDB调试器能够处理系统中每个GPU上同时运行的数千个线程。CUDA-GDB提供了无缝的调试体验，可以同时调试应用程序的CPU和GPU部分。

【GitHub热门开源】构建NLP深度学习模型其实就是搭积木

在构建自然语言理解深度学习模型过程中，研究人员或者工程师们经常需要在编程细节和代码调试上花费大量精力，而不是专注于模型架构设计与参数调整。

Ubuntu中配置TensorFlow使用环境的方法

TensorFlow™是一个基于数据流编程（dataflow programming）的符号数学系统，被广泛应用于各类机器学习（machine learning）算法的编程实现，其前身是谷歌的神经网络算法库DistBelief。

Rust 与 GPU 编程的现状与前景探究

话说，程序员三大浪漫，操作系统、编译器和图形处理。Rust 语言已经攻陷了其中两大浪漫，操作系统和编译器，那么图形处理呢？Rust 语言还能“浪”起来吗?

深度学习开发环境调查结果公布，你的配置是这样吗？（附新环境配置）

机器之心整理参与：李泽南、李亚洲本周一（6 月 19 日）机器之心发表文章《我的深度学习开发环境详解：TensorFlow + Docker + PyCharm 等，你的呢（附问卷）》介绍了研究员 Killian 的深度学习开发环境：TensorFlow + Docker + PyCharm + OSX Fuse + Tensorboard，并附了一份调查问卷想要了解机器之心读者配置的开发环境、对编程语言、框架的使用情况。虽然获得的反馈量比较有限，但我们也观察到了一些比较有趣的现象。在这篇文章中，我们将

【Rust日报】 2019-06-20：重磅：使用 Rust 进行 GPU 编程的库 Emu

使用 diesel-factories。这个库参考 Ruby 的 factory_bot 设计。可以对应像下面这样写：

OS开发爱好者福利来了：树莓派上编译C语言，顺便掌握一波硬件知识

近日，有人在 GitHub 上开源了一个关于树莓派的教程。不同于以往的树莓派开发，这篇教程的核心内容是讨论如何在树莓派上进行裸机编程。

嵌入式 Linux 的学习新路线

很多人喜欢从系统启动流程开始学习：先学习裸机，裸机集合起来就是 u-boot，再学习内核移植、驱动开发，接下来学习根文件系统，最后学习 APP 开发。

不能更详细的PyTorch环境安装与配置

PyTorch是Facebook团队于2017年1月发布的一个深度学习框架，虽然晚于TensorFlow、Keras等框架，但自发布之日起，其关注度就在不断上升，目前在GitHub上的热度已超过Theano、Caffe、MXNet等框架。

FPGA在深度学习应用中或将取代GPU

人工智能的兴起触发了市场对 GPU 的大量需求，但 GPU 在 AI 场景中的应用面临使用寿命短、使用成本高等问题。现场可编程门阵列 (FPGA) 这一可以定制化硬件处理器反倒是更好的解决方案。随着可编程性等问题在 FPGA 上的解决，FPGA 将成为市场人工智能应用的选择。

【TensorFlow实战——笔记】第2章：TensorFlow和其他深度学习框架的对比

可以看到各大主流框架基本都支持Python，目前Python在科学计算和数据挖掘领域可以说是独领风骚。虽然有来自R、Julia等语言的竞争压力，但是Python的各种库实在是太完善了，Web开发、数据可视化、数据预处理、数据库连接，爬虫等无所不能，有一个完美的生态环境。仅在数据挖掘工具链上，Python就有Numpy、SciPy、Pandas、Scikit-learn、XGBoost等组件，做数据采集和预处理都非常方便，并且之后的模型训练阶段可以和TensorFlow等基于Python的深度学习框架完美衔接。

Hinton等谈深度学习十年；PyTorch落地Linux基金会的影响；机器学习界的“GitHub”｜AI系统前沿动态

扎克伯格亲自宣布，PyTorch基金会已新鲜成立，并归入Linux基金会旗下，管理委员会成员，包括Meta、AMD、AWS、谷歌云、微软和英伟达。Meta表示，PyTorch成功背后的驱动力，是开源社区充满活力的持续增长。成立基金会将确保社区成员以透明和公开的方式作出决定。

微软75亿收购Github，微软以开发者为中心的初心不变

前天关于微软要收购 GitHub 的消息传出后，很多人都纷纷讨论，希望 GitHub 能够独立存在，不被任何大厂收购，可是 GitHub 也要生存啊。那又有人说：希望是 Google 来收购 GitH

深度学习手把手系列文章归档

【手把手AI项目】一、安装win10+linux-Ubuntu16.04的双系统（全网最详细）

基于Google Colaboratory安装Go语言编译器操作流程

Colab is a hosted Jupyter Notebook service that requires no setup to use and provides free access to computing resources, including GPUs and TPUs. Colab is especially well suited to machine learning, data science, and education.

MXNet Scala发布图像分类API|附使用教程

这次发布的 Scala，里面的推理应用程序致力于优化开发者体验。Scala 是一个通用目的程序语言，支持功能性编程和较强的静态类型系统，它被用于平台的高度分布式处理像 Apache Spark。

CUDA 6中的统一内存模型

白嘉庆，西邮陈莉君教授门下研一学生。曾在华为西安研究所任C++开发一职，目前兴趣是学习Linux内核网络安全相关内容。

统一通信 X(UCX) 实现高性能便携式网络加速-UCX入门教程HOTI2022

官方文档: https://openucx.readthedocs.io/en/master/

更新太快，CUDA 12.0工具包正式发布啦

一下子，CUDA 12.0就出来啦！NVIDIA表示：此版本是多年来的第一个主要版本，它侧重于新的编程模型和通过新硬件功能加速 CUDA 应用程序。

很火的深度学习框架PyTorch怎么用？手把手带你安装配置

2015，你不可不知的九大开源事件

2015年只剩下一周了，回过头看看发现2015异彩纷呈，称为开源之年也不过分。企业用户以前所未有的速度拥抱开源，不仅如此，像 Cloud Foundry 和 OpenStack 这样的宿敌也一起协作共

011

【Rust日报】2022-06-08 Rust wgpu 图形编程教程

该系列为 YouTube 视频系列，近期系列视频见：https://www.reddit.com/r/rust/comments/v7ql92/rust_wgpu_graphics_programming_tutorial_youtube/

浅析GPU计算——cuda编程

在《浅析GPU计算——CPU和GPU的选择》一文中，我们分析了在遇到什么瓶颈时需要考虑使用GPU去进行计算。本文将结合cuda编程来讲解实际应用例子。（转载请指明出于breaksoftware的csdn博客）

CUDA Toolkit 11.8 新功能揭晓

NVIDIA 发布了最新的 CUDA Toolkit 软件版本 11.8。此版本的重点是通过新的硬件功能增强编程模型和 CUDA 应用程序加速。 NVIDIA Hopper 和 Ada Lovelace 中特定于架构的新功能最初是通过库和框架增强功能公开的。NVIDIA Hopper 架构的完整编程模型增强功能将从 CUDA Toolkit 12 系列开始发布。 CUDA 11.8 有几个重要的特性。这篇文章提供了关键功能的概述。支持NVIDIA Hopper 和 NVIDIA Ada 架构 CUDA 应

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐