首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

CUDA Toolkit 11.8 新功能揭晓

支持NVIDIA Hopper 和 NVIDIA Ada 架构 CUDA 应用程序可以立即受益于新 GPU 系列中增加的流式多处理器 (SM) 数量、更高的内存带宽和更高的时钟频率。...简化NVIDIA JetPack 安装 NVIDIA JetPack 为 Jetson 平台上的硬件加速 AI-at-the-edge 提供了完整的开发环境。...Nsight 计算 在Nsight Compute中,您可以公开低级性能指标、调试 API 调用和可视化工作负载,以帮助优化 CUDA 内核。...Nsight Compute for CUDA 11.8 中也包含一个新示例。该示例提供源代码和预先收集的结果,引导您完成整个工作流程,以识别和修复未合并的内存访问问题。...Nsight 系统 使用Nsight Systems进行分析可以深入了解诸如 GPU starvation、不必要的 GPU 同步、CPU 并行化不足以及跨 CPU 和 GPU 的昂贵算法等问题。

1.8K30

如何轻松了解深度学习模型中使用了混合精度?

NVIDIA Volta架构和Turing架构的GPU引入了TensorCore,它在单精度数学管道上提供了显著的吞吐量加速。...以下Nvidia工具可以让您分析您的模型是否最大限度地利用TensorCore。...Nsight Systems Nvidia Nsight Systems为开发人员提供了一个全系统的性能分析工具,提供了一个完整和统一的视图,说明他们的应用程序如何利用计算机的CPU和GPU。...开发人员可以使用NVTX(NVIDIA工具扩展库)注释源代码,在nsight系统的时间线查看器中轻松突出显示函数调用。在识别出瓶颈之后,可以使用nsight计算对单个内核进行分析。...Nsight Compute Nsight Compute是CUDA应用程序的下一代交互式内核分析器,可从CUDA 10.0工具包获得。

2.2K40

NVIDIA TensorRT 10.0大升级!可用性、性能双飞跃,AI模型支持更强大!

仿佛昨日还在探讨NVIDIA TensorRT 8.5版本的新颖特性,而本周,NVIDIA已然推出了全新的TensorRT 10.0。...NVIDIA TensorRT 模型优化器 0.11 NVIDIA TensorRT 10.0引入了一个全新的综合库——NVIDIA TensorRT Model Optimizer。...Nsight 深度学习设计器 TensorRT 10.0新增了对Nsight Deep Learning Designer 2024.1(抢先体验版)的分析和引擎构建支持。...Nsight Deep Learning Designer通过提供网络推理性能的直观诊断,助力我们调整模型,以达到性能目标并充分利用GPU资源。...Nsight Deep Learning Designer 2024.1 可视化了 TensorRT 10.0 模型,用于实时检查和控制推理过程 值得一提的是,Nsight Deep Learning

39900
领券