前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >NVIDIA发布TensorRT 8.6:硬件和版本兼容性更新,性能和控制增强

NVIDIA发布TensorRT 8.6:硬件和版本兼容性更新,性能和控制增强

作者头像
GPUS Lady
发布2023-05-29 14:32:44
1.2K0
发布2023-05-29 14:32:44
举报
文章被收录于专栏:GPUS开发者GPUS开发者

NVIDIA GTC期间,发布了很多软件堆栈和库的升级,而TensorRT 8.6也是其中之一。这是一款优化深度学习模型的强大软件工具。最新版本包括几个新功能,包括硬件和版本兼容性、性能改进和优化级别构建器标志。

其中最重要的更新之一是硬件和版本兼容性功能。以前,升级硬件或TensorRT版本需要重新构建,这可能很昂贵且耗时。然而,新功能可以实现硬件和版本兼容的构建,在升级过程中无需重新构建。

同时,进行了性能改进,包括改进了fMHA和支持长seqlen,类似于flash attention。FasterDynamicShape现在已默认启用,并且H100性能得到了提高。

新的优化级别构建器标志允许用户在构建时间和性能之间进行权衡。此功能使用户对其模型的优化具有更多控制权,使其更容易平衡性能和时间限制。

TensorRT 8.6还包括支持CUDA 12.X和细粒度多流控制。这使用户可以调整网络中的流数量,根据其特定需求优化性能。

NVIDIA不断致力于改进TensorRT,为用户提供优化其深度学习模型的最新工具和功能。通过新的硬件和版本兼容性功能和其他改进,TensorRT 8.6无疑将成为在人工智能领域工作的开发人员和研究人员的游戏规则改变者。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2023-03-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 GPUS开发者 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档