NVIDIA TensorRT是一个高性能的深度学习推理优化器和runtime,为深度学习推理应用程序提供低延迟和高吞吐量。您可以从每个深度学习框架中导入经过训练的模型到TensorRT中,并轻松地创建可以集成到更大的应用程序和服务中的高效推理引擎。
本视频演示了使用NVIDIA TensorRT优化基于多层感知器的推荐系统(recommendation systems)的步骤,该系统是针对MovieLens数据集进行的。
这段视频中有五个要点:
本文分享自 GPUS开发者 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!