开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

如何通过并行运行CPU和GPU来更快地训练神经网络

通过并行运行CPU和GPU可以更快地训练神经网络。CPU和GPU在神经网络训练中扮演不同的角色，合理利用它们的并行计算能力可以提高训练速度。

首先，CPU负责管理和调度任务，处理数据的预处理和后处理工作。它可以处理复杂的控制流程和逻辑判断，以及一些无法并行化的任务。在神经网络训练过程中，CPU通常负责数据的加载、预处理、模型的初始化和保存等工作。

而GPU则负责进行大规模的并行计算，特别擅长处理矩阵运算和向量运算。神经网络的训练过程中，大部分计算都可以并行化，因此将计算任务交给GPU可以大幅提高训练速度。GPU通常通过并行计算的方式同时处理多个训练样本，加速了神经网络的前向传播和反向传播过程。

为了实现CPU和GPU的并行运行，可以使用一些深度学习框架，如TensorFlow、PyTorch等，它们提供了对GPU的支持，并且可以自动将计算任务分配给CPU和GPU。在使用这些框架时，可以通过设置合适的参数和配置，将计算任务合理地分配给CPU和GPU，充分发挥它们的计算能力。

此外，还可以使用一些优化技术来进一步提高训练速度。例如，使用批量归一化（Batch Normalization）技术可以加速神经网络的收敛过程；使用分布式训练技术可以将训练任务分布到多台机器或多个GPU上进行并行计算；使用混合精度训练技术可以减少计算量，提高训练速度等。

腾讯云提供了丰富的云计算产品和服务，适用于各种场景和需求。在神经网络训练方面，腾讯云提供了GPU云服务器（GPU Cloud Server）和深度学习容器（Deep Learning Container）等产品，可以满足用户对于高性能计算和深度学习的需求。具体产品和服务的介绍和链接地址可以参考腾讯云官方网站。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

Uber开源Atari，让个人计算机也可以快速进行深度神经进化研究

Uber近期发布了一篇文章，公开了五篇关于深度神经进化的论文，其中包括发现了遗传算法可以解决深层强化学习问题，而一些流行的方法也可替代遗传算法，如深度Q-learning和策略梯度。这项研究是Salimans等人在2017年进行的，另一种神经进化算法，即进化策略（ES）同样可以解决问题。Uber进一步阐述了以下问题：如何通过更多地探索更新智能体所带来的压力形式来改进ES；ES是如何与梯度下降联系起来的。这些研究花费巨大，通常需要720到3000个CPU，并分布在巨大，高性能的计算集群中，因此对于大多数研究人员、学生、公司和业余爱好者来说，深度神经进化研究似乎遥不可及。

04

业界 | 在个人电脑上快速训练Atari深度学习模型：Uber开源「深度神经进化」加速版

选自Uber AI 作者：Felipe Petroski Such、Kenneth O. Stanley、Jeff Clune 机器之心编译参与：路、李泽南 Uber 在去年底发表的研究中发现，通过使用遗传算法高效演化 DNN，可以训练含有超过 400 万参数的深度卷积网络在像素级别上玩 Atari 游戏；这种方式在许多游戏中比现代深度强化学习算法或进化策略表现得更好，同时由于更好的并行化能达到更快的速度。不过这种方法虽好但当时对于硬件的要求很高，近日 Uber 新的开源项目解决了这一问题，其代码可以让一

08

【业界】IBM称其机器学习库的速度比TensorFlow快了46倍

AiTechYun 编辑：nanan IBM声称POWER9服务器和Beastly处理器（GPU）相结合，可以让Google Cloud发生颠覆。 IBM宣称，其POWER服务器上的机器学习不仅比Go

04

4小时学会雅达利游戏，AI需要几台电脑？

昨天，优步AI Lab开源了深度神经进化的加速代码。其博客上称，哪怕用户只有一台电脑（台式机），用这个代码也能训练出会打雅达利的AI。而且只需要4！小！时！

02

深度神经进化加速：只需 4 个小时就在个人电脑上训练出强化学习模型

AI 研习社：近日 Uber AI Lab 开源了一组进化算法代码，它的特点是可以高速（同时也更廉价地）进行进化策略研究。根据介绍，训练神经网络玩 Atari 游戏的时间可以从原来在 720 个 CPU 组成的集群上花费 1 个小时，到现在在一台桌面级电脑上只需要 4 个小时。

03

干货 | 深度神经进化加速：只需 4 个小时就在个人电脑上训练出强化学习模型

近日 Uber AI Lab 开源了一组进化算法代码，它的特点是可以高速（同时也更廉价地）进行进化策略研究。根据介绍，训练神经网络玩 Atari 游戏的时间可以从原来在 720 个 CPU 组成的集群上花费 1 个小时，到现在在一台桌面级电脑上只需要 4 个小时。

02

【干货】神经增强：用 Python 实现深度学习超分辨率处理

【新智元导读】神经网络基于样本图像的训练为模糊图像补充细节，从而把模糊图像变高清。它不能把你的照片重建成一模一样的高清版。这只有好莱坞大片才有可能做到——但使用深度学习和神经增强（Neural Enhance）实现的“创造性 AI”作品同样很酷！想得到如《犯罪现场调查》中CSI实验室那种提高照片清晰度的技术吗？感谢深度学习和神经增强（#NeuralEnhance）技术，现在已经能够训练一个神经网络把照片放大 2 倍，甚至 4 倍。通过增加神经元数目或使用与你的低分辨率图像相似的数据集进行训练，甚至能得到更

05

想入门深度学习不会搭建环境？手把手教你在Amazon EC2上安装Keras

大数据文摘作品，转载要求见文末编译 | Molly、寒小阳、Yawei 随着我们使用的神经网络越来越复杂，我们需要更强劲的硬件。我们的个人电脑一般很难胜任这样大的网络，但是你可以相对轻松地在Amazon EC2服务中租到一台强劲的电脑，并按小时支付租金。我用的是Keras，一个神经网络的开源python库。由于用法十分简单，它很适合入门深度学习。它基于Tensorflow，一个数值计算的开源库，但是也可以使用Theano。租到的机器可以使用Jupyter Notebook通过浏览器来访问。Jupyter

02

前沿 | 18000块GPU的深度学习机器：橡树岭实验室即将推出Summit超级计算机

选自Nextplatform 作者：Nicole Hemsoth 机器之心编译参与：黄小天、李泽南美国橡树岭国家实验室的「Titan」超级计算机是「美洲虎」的继任者。它由 18688 块 AMD Opteron 6274 16 核 CPU 与 18688 块英伟达 Tesla K20X GPU 组成，在世界超级计算机性能排名中位列第三（17590 TFlop/s，2016 年 11 月排名）。在近几年的发展中，该实验室的研究小组一直致力于使用多 GPU 优化深度神经网络的计算，为深度学习任务提供优化。橡

08

5 年提速 500 倍，英伟达 GPU 创纪录突破与技术有哪些？

AI 研习社按，2017 年 5 月，在 GTC 2017 上，英伟达 CEO 黄仁勋发布 Volta 架构 Tesla V100，它被称为史上最快 GPU 加速器。2018 年 3 月，同样也是在 GTC 上，黄仁勋发布「全球最大的 GPU」——DGX-2，搭载 16 块 V100 GPU，速度达到 2 petaflops。

04

干货 | 5年提速500倍，英伟达GPU创纪录突破与技术有哪些？

英伟达 Volta Tensor Core GPU 在深度学习社群取得了哪些巨大突破？这些突破背后有什么核心技术？

03

人工智能芯片是什么？有什么用？

2018年1月9日，全球规模最大的2018北美消费电子产品展在美国拉斯维加斯拉开帷幕。本次参展的科技企业超过4000家，包括高通、英伟达、英特尔、LG、IBM、百度在内的业界科技巨头纷纷发布了各自最新的人工智能芯片产品和战略，作为本届展会的最大看点，人工智能芯片产品无疑受到了最为广泛的关注。

07

AI框架之战继续：TensorFlow也用上了动态计算图

量子位李林 | 见到“动态”有点激动 Google今天发布了TensorFlow Fold，利用动态计算图来解决因多个输入大小结构不同无法自然地批处理到一起，而导致的处理器、内存和高速缓存利用率差的问题。你可能注意到了“动态”这两个字。上个月，Facebook发布了开源深度学习框架PyTorch，让它广受赞誉的，便是“动态”这个特性。PyTorch采用动态计算图，比使用静态计算图的TensorFlow、Caffe、CNTK等框架更易于调试和推导，使用者在修改神经网络，比如说新加一层时，不需要像在其他框

07

谷歌TPU将取代GPU？英特尔、英伟达怕了吗？

随着人工智能尤其是机器学习应用大量涌现，处理器市场群雄争霸。各厂商纷纷推出新的芯片产品，都想领跑智能时。但问题是，谁会担当这个角色呢？

01

【业界】是时候解决深度学习的生产力问题了

深度学习正在推动从消费者的手机应用到图像识别等各个领域的突破。然而，运行基于深度学习的人工智能模型带来了许多挑战。最困难的障碍之一是训练模型所需的时间。需要处理大量的数据和构建基于深度学习的人工智能

06

解读主流的人工智能芯片有什么不同？

在全球规模最大的2018北美消费电子产品展上，参展的科技企业超过4000家，包括高通、英伟达、英特尔、LG、IBM、百度在内的业界科技巨头纷纷发布了各自最新的人工智能芯片产品和战略，作为本届展会的最

09

手把手在亚马逊EC2上搭建Keras GPU

由于需要使用越来越复杂的神经网络，我们还需要更好的硬件。但我们的电脑通常不能承受那么大的网络，不过你可以相对容易地在亚马逊上租用一个功能强大的计算机，比如E2服务你可以相对容易地按照小时租用在亚马逊EC2服务。我使用Keras——一个开源神经网络Python库。因为它的易用性，所以初学者可以很容易开始自己的深度学习旅程。它建立在TensorFlow之上（但是Theano也可以使用）—— 一个用于数值计算的开源软件库。租借的机器将通过浏览器使用Jupyter Notebook ——一个网络应用程序，允许共享

06

【TensorFlow实战——笔记】第2章：TensorFlow和其他深度学习框架的对比

可以看到各大主流框架基本都支持Python，目前Python在科学计算和数据挖掘领域可以说是独领风骚。虽然有来自R、Julia等语言的竞争压力，但是Python的各种库实在是太完善了，Web开发、数据可视化、数据预处理、数据库连接，爬虫等无所不能，有一个完美的生态环境。仅在数据挖掘工具链上，Python就有Numpy、SciPy、Pandas、Scikit-learn、XGBoost等组件，做数据采集和预处理都非常方便，并且之后的模型训练阶段可以和TensorFlow等基于Python的深度学习框架完美衔接。

01

前沿 | IBM全新AI芯片设计登上Nature：算力是GPU的100倍

用 GPU 运行神经网络的方法近年来已经为人工智能领域带来了惊人的发展，然而两者的组合其实并不完美。IBM 研究人员希望专门为神经网络设计一种新芯片，使前者运行能够更快、更有效。

00

谷歌发布 TensorFlow Fold，支持动态计算图，GPU 增速 100 倍

【新智元导读】谷歌官方博客最新发布TensorFlow Fold，通过为每个输入构建单独的计算图解决由于输入的大小和结构不同导致的问题。此外，通过动态批处理，实现了在 CPU上增速10倍以上，在GPU

09

深度卷积神经网络 CNNs 的多 GPU 并行框架及其在图像识别的应用

将深度卷积神经网络（Convolutional Neural Networks, 简称CNNs）用于图像识别在研究领域吸引着越来越多目光。由于卷积神经网络结构非常适合模型并行的训练，因此以模型并行+数据并行的方式来加速Deep CNNs训练，可预期取得较大收获。Deep CNNs的单机多GPU模型并行和数据并行框架是腾讯深度学习平台的一部分，腾讯深度学习平台技术团队实现了模型并行和数据并行技术加速Deep CNNs训练，证实模型拆分对减少单GPU上显存占用有效，并且在加速比指标上得到显著收益，同时可

05

Mariana CNN 并行框架与图像识别

本文是腾讯深度学习系列文章的第三篇，聚焦于腾讯深度学习平台Mariana中深度卷积神经网络Deep CNNs的多GPU模型并行和数据并行框架。将深度卷积神经网络（Convolutional Neural Networks, 简称CNNs）用于图像识别在研究领域吸引着越来越多目光。由于卷积神经网络结构非常适合模型并行的训练，因此以模型并行+数据并行的方式来加速Deep CNNs训练，可预期取得较大收获。Deep CNNs的单机多GPU模型并行和数据并行框架是Mariana的一部分，Mariana技术团队

07

一块V100运行上千个智能体、数千个环境，这个「曲率引擎」框架实现RL百倍提速

机器之心报道编辑：张倩在强化学习研究中，一个实验就要跑数天或数周，有没有更快的方法？近日，来自 SalesForce 的研究者提出了一种名为 WarpDrive（曲率引擎）的开源框架，它可以在一个 V100 GPU 上并行运行、训练数千个强化学习环境和上千个智能体。实验结果表明，与 CPU+GPU 的 RL 实现相比，WarpDrive 靠一个 GPU 实现的 RL 要快几个数量级。深度强化学习是一种训练 AI 智能体的强大方法。然而，如何将强化学习应用于多个智能体或高维状态、观察结果、行动空间等复杂

01

《Scikit-Learn、Keras与TensorFlow机器学习实用指南（第二版）》第19章规模化训练和部署TensorFlow模型

有了能做出惊人预测的模型之后，要做什么呢？当然是部署生产了。这只要用模型运行一批数据就成，可能需要写一个脚本让模型每夜都跑着。但是，现实通常会更复杂。系统基础组件都可能需要这个模型用于实时数据，这种情况需要将模型包装成网络服务：这样的话，任何组件都可以通过REST API询问模型。随着时间的推移，你需要用新数据重新训练模型，更新生产版本。必须处理好模型版本，平稳地过渡到新版本，碰到问题的话需要回滚，也许要并行运行多个版本做AB测试。如果产品很成功，你的服务可能每秒会有大量查询，系统必须提升负载能力。提升负载能力的方法之一，是使用TF Serving，通过自己的硬件或通过云服务，比如Google Cloud API平台。TF Serving能高效服务化模型，优雅处理模型过渡，等等。如果使用云平台，还能获得其它功能，比如强大的监督工具。

02

业界 | 剖析用于深度学习的硬件：GPU、FPGA、ASIC和DSP

选自Medium 作者：Eugenio Culurciello 机器之心编译参与：Rick R、吴攀在这篇文章中，作者Eugenio Culurciello简述了几类硬件设计，希望能为大家更快的运行神经网络提供洞见。我喜欢深度学习... 深度学习最近取得的成功势不可挡：从图像分类和语音识别到图片标注、理解视觉场景、视频概述、语言翻译、绘画，甚至是生成图像、语音、声音和音乐！ …而我想让它运行得飞快！其成果令人震惊，因而需求就会增长。比如你是谷歌/ Facebook / Twitter 的工作人员

AI计算，为什么要用GPU？

在之前的文章里，小枣君说过，行业里通常会把半导体芯片分为数字芯片和模拟芯片。其中，数字芯片的市场规模占比较大，达到70%左右。

01

开发 | 除了性价比排名，如何选购深度学习 GPU

AI科技评论按：与“传统” AI 算法相比，深度学习（DL）的计算性能要求，可以说完全在另一个量级上。而 GPU 的选择，会在根本上决定你的深度学习体验。那么，对于一名 DL 开发者，应该怎么选择合适

06

玩深度学习选哪块英伟达 GPU？有性价比排名还不够！

与“传统” AI 算法相比，深度学习（DL）的计算性能要求，可以说完全在另一个量级上。而 GPU 的选择，会在根本上决定你的深度学习体验。那么，对于一名 DL 开发者，应该怎么选择合适的 GPU 呢？这篇文章将深入讨论这个问题，聊聊有无必要入手英特尔协处理器 Xeon Phi，并将各主流显卡的性能、性价比制成一目了然的对比图，供大家参考。先来谈谈选择 GPU 对研究深度学习的意义。更快的 GPU，能帮助新人更快地积累实践经验、更快地掌握技术要领，并把这些应用于新的任务。没有快速的反馈，从错误中学习要花费

收藏 | 2021 十大机器学习库

来源：大数据与机器学习文摘本文约2600字，建议阅读9分钟本文为你介绍2021年最为重要的10个 Python 机器学习相关的第三方库。 Python 之于机器学习，可以说是最为锋利的武器；而机器学习之于 Python，则有着扩大影响再造辉煌的助力。二者相辅相成，以至于一提到机器学习，人们自然而然地就想到了 Python，虽然有些狭隘，但是背后也有其存在的必然性！今天我们就来介绍2021年最为重要的10个 Python 机器学习相关的第三方库，不要错过哦一、TensorFlow 1. 什么 Tenso

01

肝！十大 Python 机器学习库

Python 之于机器学习，可以说是最为锋利的武器；而机器学习之于 Python，则有着扩大影响再造辉煌的助力。二者相辅相成，以至于一提到机器学习，人们自然而然的就想到了 Python，虽然有些狭隘，但是背后也有其存在的必然性！

01

2021十大 Python 机器学习库

Python 之于机器学习，可以说是最为锋利的武器；而机器学习之于 Python，则有着扩大影响再造辉煌的助力。二者相辅相成，以至于一提到机器学习，人们自然而然的就想到了 Python，虽然有些狭隘，但是背后也有其存在的必然性！

01

专访 | MATLAB更新R2017b：转换CUDA代码极大提升推断速度

机器之心原创作者：蒋思源近日，Mathworks 推出了包含 MATLAB 和 Simulink 产品系列的 Release 2017b（R2017b），该版本大大加强了 MATLAB 对深度学习的支持，并简化了工程师、研究人员及其他领域专家设计、训练和部署模型的方式。该更新版本从数据标注、模型搭建、训练与推断还有最后的模型部署方面完整地支持深度学习开发流程。此外，MATLAB 这次更新最大的亮点是新组件 GPU Coder，它能自动将深度学习模型代码转换为 NVIDIA GPU 的 CUDA 代码，G

09

【玩转 GPU】GPU如何是如何AI赋能，成为AI首选工具的

图形处理单元（GPU）已成为 AI 开发的关键。它们可以大大加快训练和部署 AI 模型所涉及的计算过程。

03

《Scikit-Learn与TensorFlow机器学习实用指南》第12章设备和服务器上的分布式 TensorFlow

在第 11 章，我们讨论了几种可以明显加速训练的技术：更好的权重初始化，批量标准化，复杂的优化器等等。但是，即使采用了所有这些技术，在具有单个 CPU 的单台机器上训练大型神经网络可能需要几天甚至几周的时间。

01

Google AI提出通过数据回传加速神经网络训练方法，显著提升训练效率

过去十年来，神经网络的训练速度得到了大幅提高，使得深度学习技术在许多重要问题上的应用成为可能。随着摩尔定律即将走向终结，通用处理器的的改进未取得明显成效，机器学习社区越来越多地转向专用硬件来谋求额外的加速。

01

为深度学习选择最好的GPU

在进行机器学习项目时，特别是在处理深度学习和神经网络时，最好使用GPU而不是CPU来处理，因为在神经网络方面，即使是一个非常基本的GPU也会胜过CPU。

03

面向低功耗AI芯片上的神经网络设计

【GiantPandaCV导语】这篇文章为大家介绍了一下面向低功耗AI芯片上的神经网络设计，随着这几年神经网络和硬件（CPU,GPU,FPGA,ASIC）的迅猛发展，深度学习在包括互联网，自动驾驶，金融，安防等很多行业都得到了广泛的应用。然而当我们真正在实际部署深度学习应用的时候，许多场景例如无人驾驶对设备在功耗，成本，散热性等方面都有额外的限制，导致了无法大规模应用深度学习解决方案。感兴趣的同学可以了解一下有关如何面向AI芯片来设计神经网络。

06

深度学习“引擎”之争：GPU加速还是专属神经网络芯片？

深度学习（Deep Learning）在这两年风靡全球，大数据和高性能计算平台的推动作用功不可没，可谓深度学习的“燃料”和“引擎”，GPU则是引擎的引擎，基本所有的深度学习计算平台都采用GPU加速。同时，深度学习已成为GPU提供商NVIDIA的一个新的战略方向，以及3月份的GTC 2015的绝对主角。那么，GPU用于深度学习的最新进展如何？这些进展对深度学习框架有哪些影响？深度学习开发者应该如何发挥GPU的潜力？GPU与深度学习结合的前景以及未来技术趋势到底是怎么样的？在日前的NVIDIA深度学习中

04

教程 | 斯坦福CS231n 2017最新课程：李飞飞详解深度学习的框架实现与对比

选自Stanford 作者：李飞飞等机器之心编译参与：Smith、蒋思源斯坦福大学的课程 CS231n (Convolutional Neural Networks for Visual Recognition) 作为深度学习和计算机视觉方面的重要基础课程，在学界广受推崇。今年 4 月，CS231n 再度开课，全新的 CS231n Spring 2017 仍旧由李飞飞带头，带来了很多新鲜的内容。今天机器之心给大家分享的是其中的第八讲——深度学习软件（Deep Learning Software）。主

08

深度学习框架Keras简介

深度学习的框架Tensorflow,Pytorch,Keras,Theano..,每个都有它自身的优势，有的性能好，有的学习曲线平滑，有的部署方便。

06

哪种芯片架构将成为人工智能时代的开路先锋

【IT168 评论】如果用刀来比喻芯片，通用处理器好比一把瑞士军刀，人工智能时代好比要拿刀来切肉，瑞士军刀可以拿来用，但它并非是为切肉设计的，所以效果并非最好。因此，需要专门打造一把切肉的刀，这把刀既要方便切肉，又要方便剁骨头，还需要具有一定的通用性。从技术上而言，深度学习的人工神经网络算法与传统计算模式不同，它能够从输入的大量数据中自发的总结出规律，从而举一反三，泛化至从未见过的案例中。因此，它不需要人为的提取所需解决问题的特征或者总结规律来进行编程。人工神经网络算法实际上是通过大量样本数据训练建立了输

06

研学社·系统组 | 实时深度学习的推理加速和持续训练

机器之心原创作者：Yanchen Wang 参与：蒋思源、李亚洲作者 Yanchen 毕业于普林斯顿大学机器学习方向，现就职于微软Redmond总部，从事大规模分布式机器学习和企业级AI研发工作。在该篇文章中，作者介绍了实时深度学习的推理加速和持续性训练。引言深度学习变革了许多计算机视觉和自然语言处理（NLP）领域内的任务，它为越来越多的消费者和工业产品提供更强大的智能，并潜在地影响了人们在日常经验和工业实践上的标准流程。从理论上来说，深度学习和其他基于统计机器学习方法的自动化系统十分类似，它们都可

09

为深度学习选择最好的GPU

📷 来源：DeepHub IMBA 本文约3400字，建议阅读7分钟加快训练速度，更快的迭代模型。在进行机器学习项目时，特别是在处理深度学习和神经网络时，最好使用GPU而不是CPU来处理，因为在神

04

AI新技术：利用神经网络对图片进行超级压缩

像神经网络这样的数据驱动算法已席卷全球。他们最近的激增是由于硬件变得更加便宜也更加强大，同时也不缺乏大量的数据的支持。神经网络目前发展到“图像识别”，“自然语言理解”等认知任务，当然也仅限于此类任务。在这篇文章中，我将讨论一种使用神经网络压缩图像的方法，以更快的速度实现图像压缩的最新技术。本文基于“基于卷积神经网络的端到端压缩框架”（https://arxiv.org/pdf/1708.00838v1.pdf）。你需要对神经网络有一些熟悉，包括卷积和损失函数。什么是图像压缩图像压缩是转换图像使其

03

主流深度学习框架对比：必定有一款适合你！

现在机器学习逐渐成为行业热门，经过二十几年的发展，机器学习目前也有了十分广泛的应用，如：数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、DNA序列测序、语音和手写识别、战略游戏和

09

Tensorflow入门教程（九）——Tensorflow数据并行多GPU处理

上一篇我介绍了用Python来构建原型内核和常用可视化方法。这一篇我会说Tensorflow如何数据并行多GPU处理。

03

推动网络创新的利器：GPU加速的AI开发实践【玩转 GPU】

作为一名网络工程师，我对网络技术的创新和应用始终保持着热忱。在当前人工智能（AI）蓬勃发展的背景下，GPU加速的AI开发实践成为推动网络创新的一项强大工具。在本文中，我将分享关于GPU加速的AI开发实践，以及其在网络领域的应用和影响。

03

切换JAX，强化学习速度提升4000倍！牛津大学开源框架PureJaxRL，训练只需GPU

---- 新智元报道编辑：LRS 【新智元导读】加入光荣的JAX-强化学习进化！还在为强化学习运行效率发愁？无法解释强化学习智能体的行为？最近来自牛津大学Foerster Lab for AI Research（FLAIR）的研究人员分享了一篇博客，介绍了如何使用JAX框架仅利用GPU来高效运行强化学习算法，实现了超过4000倍的加速；并利用超高的性能，实现元进化发现算法，更好地理解强化学习算法。文章链接：https://chrislu.page/blog/meta-disco/ 代码链

02

CVPR 2017李沐介绍MXNet新接口Gluon：高效支持命令式与符号式编程

选自Github 机器之心编译参与：Smith、蒋思源 MXNet 现已广泛应用于生产环境中，并且因为其运行速度而饱受赞誉。现在，MXNet 有了十分重要的新接口 Gluon，MXNet 可以通过它令科研工作变得更加简单。本文将简要介绍同时具备命令式执行和符号式执行的接口 Gluon，并且为读者介绍李沐博士在 CVPR 2017 上所做的 MXNet/Gluon 教程。机器之心也将对使用 Gluon 构建卷积神经网络和实现并行计算的过程与优势这两部分内容进行展开。更详细的内容请查看李沐博士的 Github

05

不能更详细的PyTorch环境安装与配置

PyTorch是Facebook团队于2017年1月发布的一个深度学习框架，虽然晚于TensorFlow、Keras等框架，但自发布之日起，其关注度就在不断上升，目前在GitHub上的热度已超过Theano、Caffe、MXNet等框架。

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭