开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

为什么tf-serving不能部署tensorrt优化的pb？

TensorFlow Serving（tf-serving）是一个用于部署机器学习模型的开源系统，它提供了一个高性能、可扩展的服务端框架。然而，tf-serving目前不支持直接部署经过TensorRT优化的TensorFlow模型（pb文件），原因如下：

TensorRT是NVIDIA推出的用于深度学习推理的高性能优化库，它可以通过优化网络结构、减少计算精度、融合操作等技术来提高推理性能。然而，TensorRT优化的模型与原始的TensorFlow模型存在一些不兼容的地方，例如TensorRT不支持某些TensorFlow操作或特性，或者在优化过程中引入了一些限制。
TensorFlow Serving是基于TensorFlow框架构建的，它的设计目标是提供一个通用的、可扩展的模型服务端框架，能够支持多种模型格式和推理需求。然而，由于TensorRT优化的模型与原始的TensorFlow模型存在不兼容性，tf-serving并没有直接集成TensorRT的支持。

尽管tf-serving不能直接部署TensorRT优化的pb文件，但可以通过其他方式实现TensorRT与tf-serving的集成。一种常见的做法是将TensorRT优化的模型转换为TensorFlow SavedModel格式，然后使用tf-serving部署该SavedModel。这样可以充分利用TensorRT的推理优化能力，并且能够与tf-serving的其他功能无缝集成。

总结起来，tf-serving不能直接部署TensorRT优化的pb文件是因为两者之间存在不兼容性，但可以通过将TensorRT优化的模型转换为TensorFlow SavedModel格式来实现集成。

相关搜索:为什么Haskell不能优化这个重复的函数调用？为什么node js中的云函数不能正确部署为什么Spring不能自动部署我的云流处理器？为什么在Python中使用Mystic来优化非线性约束优化时，我会收到一个“不能简单的不等式”错误？为什么在使用链接时优化时不能捕获这个抛出的对象？为什么我不能创建针对App事件(即购买)进行优化的广告集？为什么我不能在生产服务器中部署Wpf应用程序？关于“信任未授予”的问题为什么我的discord.py机器人在heroku上部署后不能上线？为什么我的React应用程序不能部署在GitHub上为什么我的react站点不能部署到netlify？

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

美团视觉GPU推理服务部署架构优化实践

面对在线推理服务使用的GPU资源不断增加、GPU利用率普遍较低的挑战，美团视觉研发团队决定通过模型结构拆分和微服务化进行优化，他们提出了一种通用高效的部署架构，来解决这种常见的性能瓶颈问题。

05

【工程】深度学习模型部署的那些事儿

当我们千辛万苦完成了前面的数据获取、数据清洗、模型训练、模型评估等等步骤之后，终于等到老大说“上线”啦。想到辛苦训练出来的模型要被调用还有点小激动呢，可是真当下手的时候就有点懵了：模型要怎么部署？部署在哪里？有什么限制或要求？

01

怎样用英伟达TensorRT优化TensorFlow Serving的性能？谷歌工程师一文详解

怎样用TensorFlow Serving系统，结合英伟达的Tensor RT，实现高性能深度学习推理？

04

业界 | TensorFlow 携手 NVIDIA，使用 TensorRT 优化 TensorFlow Serving 性能

AI 科技评论按：日前，TensorFlow 团队与 NVIDIA 携手合作，将 NVIDIA 用来实现高性能深度学习推理的平台——TensorRT 与 TensorFlow Serving 打通结合，使用户可以轻松地实现最佳性能的 GPU 推理。目前，TensorFlow Serving 1.13 已实现对 TF-TRT 的支持，而不久后 TensorFlow 2.0 也将支持 TF-TRT 的实现。 TensorFlow 在官方博客中对这项成果进行了发布，雷锋网 AI 科技评论编译如下。

02

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

深度学习在 ctr 预估领域的应用越来越多，新的模型不断冒出。从 ctr 预估问题看看 f(x) 设计—DNN 篇（https://zhuanlan.zhihu.com/p/28202287）整理了各模型之间的联系之后，一直在琢磨这些东西如何在工业界落地。经过几个月的调研，发现目前存在的一些问题：开源的实现基本都是学术界的人在搞，距离工业应用还有较大的鸿沟模型实现大量调用底层 API，各版本实现千差万别，代码臃肿难懂，迁移成本较高单机，放到工业场景下跑不动针对存在的问题做了一些探索，摸索出一套

09

TensorRT安装及使用教程「建议收藏」

一般的深度学习项目，训练时为了加快速度，会使用多 GPU 分布式训练。但在部署推理时，为了降低成本，往往使用单个 GPU 机器甚至嵌入式平台（比如 NVIDIA Jetson）进行部署，部署端也要有与训练时相同的深度学习环境，如 caffe，TensorFlow 等。由于训练的网络模型可能会很大（比如，inception，resnet 等），参数很多，而且部署端的机器性能存在差异，就会导致推理速度慢，延迟高。这对于那些高实时性的应用场合是致命的，比如自动驾驶要求实时目标检测，目标追踪等。所以为了提高部署推理的速度，出现了很多轻量级神经网络，比如 squeezenet，mobilenet，shufflenet 等。基本做法都是基于现有的经典模型提出一种新的模型结构，然后用这些改造过的模型重新训练，再重新部署。

04

基础服务系列-安装TensorFlow Serving

git clone https://github.com/tensorflow/serving

01

微信AI的语音合成技术，让“读”书更尽兴

随着深度学习技术的发展，语音合成技术也经历了从传统的基于参数合成（HTS）至基于深度神经网络的样本级合成（Parallel WaveNet）的变革。相比与传统方法，基于神经网络的新方法在语音的自然度与可理解性上都有了突破性的提升；然而，新方法的计算开销非常大。当微信AI需要将其应用于海量在线系统中，非常难以用于生产系统。

04

Tensorflow笔记：模型保存、加载和Fine-tune

尝试过迁移学习的同学们都知道，Tensorflow的模型保存加载有不同格式，使用方法也不一样，新手会觉得乱七八糟，所以本文做一个梳理。从模型的保存到加载，再到使用，力求理清这个流程。

04

优化NVIDIA GPU性能，实现高效的模型推理

GPU已被证明是加速深度学习和AI工作负载（如计算机视觉和自然语言处理（NLP））的有效解决方案。如今许多基于深度学习的应用程序在其生产环境中使用GPU设备，例如用于数据中心的NVIDIA Tesla和用于嵌入式平台的Jetson。这提出了一个问题：如何从NVIDIA GPU设备获得最佳推理性能？

03

如何用TF Serving部署TensorFlow模型

如何将机器学习(ML)模型部署上线至生产环境已成为经常性的热门话题。为此许多公司和框架提出了各种不同的解决方案。

02

深度学习四大名著之《机器学习实战：基于Scikit-Learn、Keras和TensorFlow》第二版

《机器学习实战：基于Scikit-Learn、Keras和TensorFlow》第二版

08

2021 年了，TensorFlow 和 PyTorch 两个深度学习框架地位又有什么变化吗？

现在各大顶会开源代码没有一丝丝的tensorflow2.x，就连谷歌家自己的论文也是只有torch和jax。零零星星一些tf1的开源代码。

02

深度学习Tensorflow生产环境部署（下·模型部署篇）

部署完docker后，如果是cpu环境，可以直接拉取tensorflow/serving，如果是GPU环境则麻烦点，具体参考前一篇，这里就不再赘述了。

02

腾讯云 TACO Infer 助力自动语音识别推理业务 QPS 三倍提升

导语机器学习领域最重要的两个问题是机器学习模型的生产（模型训练）和机器学习模型的部署（模型推理）。其中，模型的部署关注两个方面：模型推理的性能问题：目标是通过计算图层面的优化，算子层面的优化等方式，在保证模型效果的前提之下，提升模型计算（模型推理）的性能。模型部署的工程问题：主要着眼于对模型部署过程中的整个模型的生命周期进行管理，降低模型部署的工程量。目前常见的推理优化框架有侧重于推理性能提升的 TensorRT、NVIDIA 基于 TensorRT 的 Triton、Tensorflow 社区的

07

[pytorch] PyTorch图像分类框架(支持多种主流分类模型)

Git Repo：https://github.com/MachineLP/PyTorch_image_classifier

03

TensorFlow-Serving的使用实战案例笔记（tf=1.4）

最近在测试一些通用模型+项目，包括：CLUE（tf+pytorch），bert4keras(keras)， Kashgari(keras+tf)等。其中如果要部署的话，就有tensorflow-serving和flask的选择了。这里刚好有一个非常好的实战例子，基于tensorflow 1.x的，比较全面。

02

使用keras和tensorflow保存为可部署的pb格式

1、在tensorflow绘图的情况下,使用tf.saved_model.simple_save()方法保存模型

04

tensorflow踩坑合集2. TF Serving & gRPC 踩坑

这一章我们借着之前的NER的模型聊聊tensorflow serving，以及gRPC调用要注意的点。以下代码为了方便理解做了简化，完整代码详见Github-ChineseNER ，里面提供了训练好的包括bert_bilstm_crf, bilstm_crf_softlexcion，和CWS+NER多任务在内的4个模型，可以开箱即用。这里tensorflow模型用的是estimator框架，整个推理环节主要分成：模型export，warmup，serving, client request四步

03

探索大模型时代下的算法工程师前景与发展路径

随着人工智能技术的飞速发展，大模型已成为当前人工智能领域的一大趋势。从最早的深度学习到如今的超大规模预训练模型，如GPT-3等，大模型在自然语言处理、计算机视觉、语音识别等领域表现出了惊人的能力。那么，在大模型时代来临的背景下，算法工程师应该如何应对，何去何从呢？

01

Kubernetes 预测性集群伸缩

在这篇文章中，科赛网后端研发工程师高朋首先介绍了 Cluster Auto Scaler 的主要设计、功能和他们对 Cluster-Autoscaler 的一些改动，使得这个组件可以支持预测性伸缩。

02

有赞算法平台之模型部署演进

模型部署作为算法工程落地的最后一公里，其天然对算法团队而言具有较高的复杂性，不仅要考虑如何高效地部署、管理不同框架模型，还需要考虑分布式服务的负载均衡、故障容错、可扩展性、资源隔离、限流、核心指标监控等问题。这些都极大的依赖于工程团队的能力，不是算法团队的强项，如何解决这最后一公里，让焦点聚焦在模型开发上，是模型部署服务模块需要解决的问题。

03

【深度学习】2021 年了，TensorFlow 和 PyTorch 两个深度学习框架地位又有什么变化吗？

链接：https://www.zhihu.com/question/452749603/answer/1826252757

05

深度学习模型压缩与优化加速（Model Compression and Acceleration Overview）

深度学习（Deep Learning）因其计算复杂度或参数冗余，在一些场景和设备上限制了相应的模型部署，需要借助模型压缩、系统优化加速、异构计算等方法突破瓶颈，即分别在算法模型、计算图或算子优化以及硬件加速等层面采取必要的手段：

01

Kubernetes 环境的 Tensorflow Serving on S3

在 Tensorflow 给的官方例子中 Use TensorFlow Serving with Kubernetes，是将模型拷贝到镜像里的，这里是会有点不太灵活，因为更新模型就要重新构建镜像，并且再去更新对应的 Pod。

01

云原生技术开发手册(新坑~待填)

项目地址：https://github.com/shikanon/cloudnative-technical-manual

02

使用tensorflow-serving部署模型

TensorFlow训练好的模型以tensorflow原生方式保存成protobuf文件后可以用许多方式部署运行。

02

kubeflow系列(三)：模型即服务，关于tensorflow serving的使用

kubeflow 中采用了 tensorflow serving 作为官方的tensorflow模型接口， TensorFlow Serving是GOOGLE开源的一个服务系统，适用于部署机器学习模型，灵活、性能高、可用于生产环境。 TensorFlow Serving可以轻松部署新算法和实验，同时保持相同的服务器架构和API。

02

tensorflow机器学习模型的跨平台上线

在用PMML实现机器学习模型的跨平台上线中，我们讨论了使用PMML文件来实现跨平台模型上线的方法，这个方法当然也适用于tensorflow生成的模型，但是由于tensorflow模型往往较大，使用无法优化的PMML文件大多数时候很笨拙，因此本文我们专门讨论下tensorflow机器学习模型的跨平台上线的方法。

02

美女小姐姐在Jetson Xavier NX上实现车道线检测

https://esthermakes.tech/blog/2021/01/09/lanenet-on-nvidia-jetson/

01

TensorFlow 到底有几种模型格式？

本文介绍了 TensorFlow 常见模型格式和载入、保存方法。TensorFlow 支持多种模型格式，包括 CheckPoint、GraphDef、SavedModel 等，这些格式之间关系密切，可以使用 TensorFlow 提供的 API 来互相转换。在训练和部署模型时，可以根据具体需求选择相应的格式。

加速深度学习在线部署，TensorRT安装及使用教程

一般的深度学习项目，训练时为了加快速度，会使用多GPU分布式训练。但在部署推理时，为了降低成本，往往使用单个GPU机器甚至嵌入式平台（比如 NVIDIA Jetson）进行部署，部署端也要有与训练时相同的深度学习环境，如caffe，TensorFlow等。由于训练的网络模型可能会很大（比如，inception，resnet等），参数很多，而且部署端的机器性能存在差异，就会导致推理速度慢，延迟高。这对于那些高实时性的应用场合是致命的，比如自动驾驶要求实时目标检测，目标追踪等。所以为了提高部署推理的速度，出现了很多轻量级神经网络，比如squeezenet，mobilenet，shufflenet等。基本做法都是基于现有的经典模型提出一种新的模型结构，然后用这些改造过的模型重新训练，再重新部署。

02

构建并用 TensorFlow Serving 部署 Wide & Deep 模型

> 正文共6912个字，4张图，预计阅读时间18分钟。 Wide & Deep 模型是谷歌在 2016 年发表的论文中所提到的模型。在论文中，谷歌将 LR 模型与深度神经网络结合在一起作为 Google Play 的推荐获得了一定的效果。在这篇论文后，Youtube，美团等公司也进行了相应的尝试并公开了他们的工作（相关链接请看本文底部）官方提供的 Wide & Deep 模型的（简称，WD 模型）教程都是使用 TensorFlow （简称，TF ）自带的函数来做的特征工程，并且模型也进行了封装，

06

《Scikit-Learn、Keras与TensorFlow机器学习实用指南（第二版）》第19章规模化训练和部署TensorFlow模型

有了能做出惊人预测的模型之后，要做什么呢？当然是部署生产了。这只要用模型运行一批数据就成，可能需要写一个脚本让模型每夜都跑着。但是，现实通常会更复杂。系统基础组件都可能需要这个模型用于实时数据，这种情况需要将模型包装成网络服务：这样的话，任何组件都可以通过REST API询问模型。随着时间的推移，你需要用新数据重新训练模型，更新生产版本。必须处理好模型版本，平稳地过渡到新版本，碰到问题的话需要回滚，也许要并行运行多个版本做AB测试。如果产品很成功，你的服务可能每秒会有大量查询，系统必须提升负载能力。提升负载能力的方法之一，是使用TF Serving，通过自己的硬件或通过云服务，比如Google Cloud API平台。TF Serving能高效服务化模型，优雅处理模型过渡，等等。如果使用云平台，还能获得其它功能，比如强大的监督工具。

02

tf43：tensorflow Serving gRPC 部署实例

版权声明：本文为博主原创文章，未经博主允许不得转载。有问题可以加微信：lp9628(注明CSDN)。 https://blog.csdn.net/u014365862/article/details/81009551

03

YOLOV5 v6.1更新 | TensorRT+TPU+OpenVINO+TFJS+TFLite等平台一键导出和部署

yolov5 release 6.1版本增加了TensorRT、Edge TPU和OpenVINO的支持，并提供了新的默认单周期线性LR调度器，以128批处理大小的再训练模型。YOLOv5现在正式支持11种不同的权重，不仅可以直接导出，还可以用于推理(detect.py和PyTorch Hub)，以及在导出后对mAP配置文件和速度结果进行验证。

01

Tensorflow笔记：通过tf.Serving+Docker部署

很多时候仅仅是线下跑一个模型，对特定一批数据进行预测并不够，需要随时来一个或几个样本都能输出结果。这时候就需要起一个服务，然后随时一个包含数据的请求过来，就返回相应的结果。架起这个服务的过程就称作“部署”。本文主要介绍通过tf.Serving+Docker来部署tensorflow模型的过程。

01

部署深度学习模型到服务器

当我们历尽千辛万苦，终于训练出来一个模型时，想不想将这个模型发布出去，让更多人的受益？

03

官宣！TensorFlow 2.0 正式发布

今年初，我们在 TensorFlow 开发者大会 (TensorFlow Dev Summit) 上发布了 TensorFlow 2.0 的 Alpha 版本。经过近 7 个月的努力，今天我们高兴的宣布，TensorFlow 2.0 正式版现已推出！

02

如何将训练好的Python模型给JavaScript使用？

从前面的Tensorflow环境搭建到目标检测模型迁移学习，已经完成了一个简答的扑克牌检测器，不管是从图片还是视频都能从画面中识别出有扑克的目标，并标识出扑克点数。但是，我想在想让他放在浏览器上可能实际使用，那么要如何让Tensorflow模型转换成web格式的呢？接下来将从实践的角度详细介绍一下部署方法！

01

TensorFlow 2.0 正式版现已发布

今年初，我们在 TensorFlow 开发者大会 (TensorFlow Dev Summit) 上发布了 TensorFlow 2.0 的 Alpha 版本。经过近 7 个月的努力，今天我们高兴的宣布，TensorFlow 2.0 正式版现已推出！

04

kubeflow系列(二)：kubeflow组件介绍

为了对kubeflow有个更直观深入的了解，对kubeflow的各组件进行简单的介绍，先从机器学习任务来看kubeflow的的实现。

06

tensorflow转换ckpt为savermodel模型的实现

save ├── saved_model.pb └── variables ├── variables.data-00000-of-00001 └── variables.index

03

Tensorflow SavedModel模型的保存与加载

这两天搜索了不少关于Tensorflow模型保存与加载的资料，发现很多资料都是关于checkpoints模型格式的，而最新的SavedModel模型格式则资料较少，为此总结一下TensorFlow如何保存SavedModel模型，并加载之。

03

推理效能最高提升至242%——腾讯云计算加速套件 TACO Kit

计算加速套件 TACO Kit 简介从推荐系统、自动驾驶到聊天机器人，AI 正逐渐渗透到我们生活的每个角落。每一次我们使用这些应用的时候，应用背后都有训练好的神经网络模型在运行一个叫做“推理”的过程。无所不在的应用，意味着推理可能会被部署在云、边、端等各种可能的硬件终端上。不同硬件所带来的异质性，不可避免地给软件设计提出了巨大的挑战。开发者经常需要在不同目标设备上开发推理应用，并使用不同平台、各自独立的软件栈及依赖。为了应对上述软件研发的挑战，腾讯发布了 TACO Kit（Tencent Acceler

01

SavedModel格式TensorFlow模型转为frozen graph

本文介绍基于Python的tensorflow库，将tensorflow与keras训练好的SavedModel格式神经网络模型转换为frozen graph格式，从而可以用OpenCV库在C++等其他语言中将其打开的方法。

01

keras模型保存为tensorflow的二进制模型方式

最近需要将使用keras训练的模型移植到手机上使用，因此需要转换到tensorflow的二进制模型。

03

精炼鉴黄师背后的故事

用AI来鉴别黄色图片，已经不是什么新鲜的事情。然而能够训练出一个可用的图像识别模型，其中所需要的细节知识还是值得学习的。

02

兼容PyTorch，25倍性能加速，国产框架OneFlow「超速」了

机器之心发布机器之心编辑部要想炼丹爽得飞起，就要选择一个顺手的炉子。作为 AI 工程师日常必不可缺的「炼丹炉」，「PyTorch 还是 TensorFlow？」已成为知乎、Reddit 等炼丹师出没之地每年都会讨论的热门话题。业界流传一种说法：PyTorch 适合学术界，TensorFlow 适合工业界。毕竟，PyTorch 是用户最喜欢的框架，API 非常友好，Eager 模式让模型搭建和调试过程变得更加容易，不过，它的静态图编译和部署体验还不令人满意。TensorFlow 恰恰相反，静态编译和部

02

兼容PyTorch，25倍性能加速，国产框架OneFlow「超速」了

关注并星标从此不迷路计算机视觉研究院公众号ID｜ComputerVisionGzq 学习群｜扫码在主页获取加入方式计算机视觉研究院专栏作者：Edison_G 要想炼丹爽得飞起，就要选一个顺手的炉子。转自《机器之心》要想炼丹爽得飞起，就要选择一个顺手的炉子。作为AI工程师日常必不可缺的「炼丹炉」，「PyTorch 还是 TensorFlow？」已成为知乎、Reddit等炼丹师出没之地每年都会讨论的热门话题。业界流传一种说法：PyTorch适合学术界，TensorFlow适合工业界。毕

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭