NVIDIA cuDNN - 用于机器学习的GPU库

NVIDIA cuDNN是用于深度神经网络的GPU加速库。它强调性能、易用性和低内存开销。NVIDIA cuDNN可以集成到更高级别的机器学习框架中,如加州大学伯克利分校的流行CAFFE软件。简单的,插入式设计可以让开发人员专注于设计和实现神经网络模型,而不是调整性能,同时还可以在GPU上实现高性能现代并行计算。

点击这里了解更多关于加快机器学习与GPU的信息。

主要特点

  • -专为NVIDIA GPU特调的,用于卷积神经网络向前和向后的卷积程序。
  • -专为最新的NVIDIA GPU架构优化
  • -针对4纬张量的任意维度排序,striding和次区域可以很容易集成到任何神经网络的执行中
  • -对于许多其他常见布局类型(ReLU, Sigmoid, Tanh, pooling, softmax )向前和向后的路径
  • -基于上下文的API,可以很容易地多线程

原文发布于微信公众号 - 吉浦迅科技(gpusolution)

原文发表时间:2014-09-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏鸿的学习笔记

深度学习性能分析(下)

我们分析了TX1设备的系统内存消耗,它使用CPU和GPU的共享内存。 图5显示最大系统内存使用量初始为常数,然后随批量大小增加。这是由于网络模型的初始存储器分配...

801
来自专栏磐创AI技术团队的专栏

使用Keras进行深度学习:(六)LSTM和双向LSTM讲解及实践

2394
来自专栏PaddlePaddle

【AI核心技术】课程十二:ResNet 超深的深度学习模型

UAI与PaddlePaddle联合推出的【AI核心技术掌握】系列课程持续更新中!

1024
来自专栏QQ大数据团队的专栏

神盾推荐——离线算法平台

1.4K6
来自专栏CreateAMind

Deep Learning Book 中文第五章-5.6 机器学习基础

学习算法:任务、性能度量、经验;容量、过拟合、欠拟合;超参数;估计、偏差、方差;最大似然估计;贝叶斯统计。

933
来自专栏量子位

深究机器学习的软肋:难以防范的对抗攻击,让机器产生了幻觉

OpenAI研究员Ian Goodfellow等人今天发表文章,详细描述了机器学习模型面临的“对抗范例(adversarial examples)”攻击,以及目...

3234
来自专栏机器之心

资源 | MIT 新发布大型数据集 ADE20K:用于场景感知、语义理解等多种任务

选自CSAIL 机器之心编译 参与:黄小天、Smith 近日,MIT 通过官网发布了一款名为 ADE20K 的数据集,可用于场景感知、解析、分割、多物体识别和语...

4447
来自专栏吉浦迅科技

【在线视频】如何在GPU上进行混合精度训练

使用精度低于FP32的系统可以减少内存使用,允许部署更大的网络。数据传输需要更少的时间,而且计算性能会提高,尤其是在NVIDIA gpu上,它的Tensor C...

3211
来自专栏LhWorld哥陪你聊算法

【强化学习篇】--强化学习案例详解一

转变为如下图:先构造奖励,达到5,即能够走得5的action则说明奖励比较高设置成100,没有达到5说明奖励比较低,设置成0。

2111
来自专栏AI研习社

微软开源 repo 1.0 ,旨在创造深度学习框架通用语言

AI 研习社按,日前,微软提出深度学习框架的通用语言——repo1.0,号称希望通过构建这一深度学习框架「Rosetta Stone(罗塞塔石碑)」,让研究者们...

1292

扫码关注云+社区