首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

为什么tf-serving不能部署tensorrt优化的pb?

TensorFlow Serving(tf-serving)是一个用于部署机器学习模型的开源系统,它提供了一个高性能、可扩展的服务端框架。然而,tf-serving目前不支持直接部署经过TensorRT优化的TensorFlow模型(pb文件),原因如下:

  1. TensorRT是NVIDIA推出的用于深度学习推理的高性能优化库,它可以通过优化网络结构、减少计算精度、融合操作等技术来提高推理性能。然而,TensorRT优化的模型与原始的TensorFlow模型存在一些不兼容的地方,例如TensorRT不支持某些TensorFlow操作或特性,或者在优化过程中引入了一些限制。
  2. TensorFlow Serving是基于TensorFlow框架构建的,它的设计目标是提供一个通用的、可扩展的模型服务端框架,能够支持多种模型格式和推理需求。然而,由于TensorRT优化的模型与原始的TensorFlow模型存在不兼容性,tf-serving并没有直接集成TensorRT的支持。

尽管tf-serving不能直接部署TensorRT优化的pb文件,但可以通过其他方式实现TensorRT与tf-serving的集成。一种常见的做法是将TensorRT优化的模型转换为TensorFlow SavedModel格式,然后使用tf-serving部署该SavedModel。这样可以充分利用TensorRT的推理优化能力,并且能够与tf-serving的其他功能无缝集成。

总结起来,tf-serving不能直接部署TensorRT优化的pb文件是因为两者之间存在不兼容性,但可以通过将TensorRT优化的模型转换为TensorFlow SavedModel格式来实现集成。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

  • TensorRT安装及使用教程「建议收藏」

    一般的深度学习项目,训练时为了加快速度,会使用多 GPU 分布式训练。但在部署推理时,为了降低成本,往往使用单个 GPU 机器甚至嵌入式平台(比如 NVIDIA Jetson)进行部署,部署端也要有与训练时相同的深度学习环境,如 caffe,TensorFlow 等。由于训练的网络模型可能会很大(比如,inception,resnet 等),参数很多,而且部署端的机器性能存在差异,就会导致推理速度慢,延迟高。这对于那些高实时性的应用场合是致命的,比如自动驾驶要求实时目标检测,目标追踪等。所以为了提高部署推理的速度,出现了很多轻量级神经网络,比如 squeezenet,mobilenet,shufflenet 等。基本做法都是基于现有的经典模型提出一种新的模型结构,然后用这些改造过的模型重新训练,再重新部署。

    04

    加速深度学习在线部署,TensorRT安装及使用教程

    一般的深度学习项目,训练时为了加快速度,会使用多GPU分布式训练。但在部署推理时,为了降低成本,往往使用单个GPU机器甚至嵌入式平台(比如 NVIDIA Jetson)进行部署,部署端也要有与训练时相同的深度学习环境,如caffe,TensorFlow等。由于训练的网络模型可能会很大(比如,inception,resnet等),参数很多,而且部署端的机器性能存在差异,就会导致推理速度慢,延迟高。这对于那些高实时性的应用场合是致命的,比如自动驾驶要求实时目标检测,目标追踪等。所以为了提高部署推理的速度,出现了很多轻量级神经网络,比如squeezenet,mobilenet,shufflenet等。基本做法都是基于现有的经典模型提出一种新的模型结构,然后用这些改造过的模型重新训练,再重新部署。

    02

    《Scikit-Learn、Keras与TensorFlow机器学习实用指南(第二版)》第19章 规模化训练和部署TensorFlow模型

    有了能做出惊人预测的模型之后,要做什么呢?当然是部署生产了。这只要用模型运行一批数据就成,可能需要写一个脚本让模型每夜都跑着。但是,现实通常会更复杂。系统基础组件都可能需要这个模型用于实时数据,这种情况需要将模型包装成网络服务:这样的话,任何组件都可以通过REST API询问模型。随着时间的推移,你需要用新数据重新训练模型,更新生产版本。必须处理好模型版本,平稳地过渡到新版本,碰到问题的话需要回滚,也许要并行运行多个版本做AB测试。如果产品很成功,你的服务可能每秒会有大量查询,系统必须提升负载能力。提升负载能力的方法之一,是使用TF Serving,通过自己的硬件或通过云服务,比如Google Cloud API平台。TF Serving能高效服务化模型,优雅处理模型过渡,等等。如果使用云平台,还能获得其它功能,比如强大的监督工具。

    02
    领券