开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Tensorflow的图形文件(.pb)太大了，不适合安卓系统使用，如何减小？

TensorFlow的图形文件(.pb)是用来存储训练好的模型的，它包含了模型的结构和参数。在移动设备上使用TensorFlow时，由于存储空间和计算资源的限制，需要尽量减小模型文件的大小。以下是几种减小TensorFlow模型文件大小的方法：

模型压缩：可以使用压缩算法对模型文件进行压缩，减小文件大小。常用的压缩算法有gzip、zip等。压缩后的模型文件可以在移动设备上解压缩后使用。
模型量化：模型量化是将模型中的浮点数参数转换为更低精度的表示，从而减小模型文件的大小。TensorFlow提供了量化工具和API，可以将模型参数转换为8位整数或更低精度的表示。
剪枝和量化：剪枝是指通过删除模型中不重要的连接或参数来减小模型的大小。量化是指将模型参数转换为低精度的表示。剪枝和量化可以结合使用，进一步减小模型文件的大小。
模型分割：如果模型文件仍然过大，可以考虑将模型分割成多个部分，分别加载和执行。这样可以在需要时只加载部分模型，减小内存占用。
模型优化：通过对模型进行优化，可以减小模型文件的大小。例如，可以使用更小的网络结构、减少模型层数、减少参数数量等。

需要注意的是，减小模型文件大小可能会导致模型性能的降低。因此，在进行模型压缩和优化时，需要权衡模型大小和性能之间的关系。

推荐的腾讯云相关产品：腾讯云AI智能优化平台（https://cloud.tencent.com/product/aiot）提供了模型压缩、量化、剪枝等功能，可以帮助用户减小模型文件大小，并提供了移动端部署的解决方案。

以上是关于如何减小TensorFlow图形文件(.pb)大小的方法和推荐的腾讯云相关产品。

相关搜索:在安卓系统中，如何使用Executor作为AsyncTask从数据库获取数据的替代方案？在采用C++的安卓系统上使用TensorFlow Lite2.0高级图形处理器如何使用CameraX在安卓系统中启动240fps的摄像头预览？如何使用ConstraintLayout在安卓系统中缩放不同屏幕尺寸的UI元素如何使用kotlin处理安卓系统上的后退按钮DrawerNavigation 如何使用OpenGL在安卓系统中渲染屏幕外的位图？如何使用PackageInstaller以编程方式卸载安卓系统中的应用如何使用下一张卡片点击安卓系统中的CardView项目如何使用速度表库在安卓系统中停止SpeedView的箭头动画如何在使用HandlerThread的安卓系统中停止ServiceHandler？

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

TensorFlow下构建高性能神经网络模型的最佳实践

作者 | 李嘉璇责编 | 何永灿随着神经网络算法在图像、语音等领域都大幅度超越传统算法，但在应用到实际项目中却面临两个问题：计算量巨大及模型体积过大，不利于移动端和嵌入式的场景；模型内存占用过大，导致功耗和电量消耗过高。因此，如何对神经网络模型进行优化，在尽可能不损失精度的情况下，减小模型的体积，并且计算量也降低，就是我们将深度学习在更广泛的场景下应用时要解决的问题。加速神经网络模型计算的方向在移动端或者嵌入式设备上应用深度学习，有两种方式：一是将模型运行在云端服务器上，向服务器发送请求，接收服务器

02

【开源公告】腾讯 AI Lab 正式开源PocketFlow，让深度学习放入手机！

11月1日，腾讯AI Lab在南京举办的腾讯全球合作伙伴论坛上宣布正式开源“PocketFlow”项目，该项目是一个自动化深度学习模型压缩与加速框架，整合多种模型压缩与加速算法并利用强化学习自动搜索合适压缩参数，解决传统深度学习模型由于模型体积太大，计算资源消耗高而难以在移动设备上部署的痛点，同时极大程度的降低了模型压缩的技术门槛，赋能移动端AI应用开发。

03

腾讯 AI Lab 正式开源PocketFlow自动化深度学习模型压缩与加速框架

11月1日，腾讯AI Lab在南京举办的腾讯全球合作伙伴论坛上宣布正式开源“PocketFlow”项目，该项目是一个自动化深度学习模型压缩与加速框架，整合多种模型压缩与加速算法并利用强化学习自动搜索合适压缩参数，解决传统深度学习模型由于模型体积太大，计算资源消耗高而难以在移动设备上部署的痛点，同时极大程度的降低了模型压缩的技术门槛，赋能移动端AI应用开发。

04

重磅实战：如何用TensorFlow在安卓设备上实现深度学习，附Demo和源码

对于个人和公司来说，存在许多状况是更希望在本地设备上做深度学习推断的：想象一下当你在旅行途中没有可靠的互联网链接时，或是要处理传输数据到云服务的隐私问题和延迟问题时。

03

边缘计算 | 在移动设备上部署深度学习模型的思路与注意点 ⛵

本文介绍AI模型适用于小型本地设备上的方法技术：压缩模型参数量，设计更小的模型结构，知识蒸馏，调整数据格式，数据复用等，并介绍移动小处理设备的类型、适用移动设备的模型框架等。

04

教程 | 如何用TensorFlow在安卓设备上实现深度学习推断

选自DataScience 作者：Chia-Chun 机器之心编译参与：Edison Ke、路雪本文作者 Chia-Chun (JJ) Fu 是加州大学圣塔芭芭拉分校的化学工程博士。她在 Insight 工作的时候，在安卓系统上用 TensorFlow 部署了一个 WaveNet 模型。本文详细介绍了部署和实现过程。对于个人和公司来说，存在许多状况是更希望在本地设备上做深度学习推断的：想象一下当你在旅行途中没有可靠的互联网链接时，或是要处理传输数据到云服务的隐私问题和延迟问题时。边缘计算（Edge c

05

业界 | 腾讯 AI Lab 正式开源PocketFlow，让深度学习放入手机！

项目访问地址：https://github.com/Tencent/PocketFlow

03

模型体积缩小至千分之一！360算法大牛分享移动端AI部署与优化实践

本文根据360算法专家史东杰在2019年软件绿色联盟开发者大会发表《AI算法在移动端安全实践和优化》主题演讲整理而成，从移动端的使用场景和建模优化两个维度介绍AI算法在360移动端的实践。

01

小白也可以操作的手机TensorFlow教程：Android版和iOS版

TensorFlow通常用于训练海量数据，但新兴的智能手机市场也不可忽略。那些不能等待未来和love Machine Learning的人正在通过制造工具来突破界限，他们的目标是拥有数万亿美元的市场。

06

最简单的模型轻量化方法：20行代码为BERT剪枝

| 导语 BERT模型在多种下游任务表现优异，但庞大的模型结果也带来了训练及推理速度过慢的问题，难以满足对实时响应速度要求高的场景，模型轻量化就显得非常重要。因此，笔者对BERT系列模型进行剪枝，并部署到实际项目中，在满足准确率的前提下提高推理速度。一. 模型轻量化模型轻量化是业界一直在探索的一个课题，尤其是当你使用了BERT系列的预训练语言模型，inference速度始终是个绕不开的问题，而且训练平台可能还会对训练机器、速度有限制，训练时长也是一个难题。目前业界上主要的轻量化方法如下

01

学习笔记TF066 : TensorFlow 移动端应用，iOS、Android系统实践

TensorFlow对Android、iOS、树莓派都提供移动端支持。移动端应用原理。移动端、嵌入式设备应用深度学习方式，一模型运行在云端服务器，向服务器发送请求，接收服务器响应；二在本地运行模型，

00

腾讯AI Lab开源世界首款自动化模型压缩框架PocketFlow：将深度学习装进口袋

导语：腾讯AI Lab机器学习中心今日宣布成功研发出世界上首款自动化深度学习模型压缩框架——PocketFlow，并即将在近期发布开源代码。这是一款面向移动端AI开发者的自动模型压缩框架，集成了当前主流（包括腾讯AI Lab自研）的模型压缩与训练算法，结合自研超参数优化组件实现了全程自动化托管式的模型压缩与加速。[1] 开发者无需了解具体算法细节，即可快速地将AI技术部署到移动端产品上，实现用户数据的本地高效处理。目前该框架正在为腾讯的多项移动端业务提供模型压缩与加速的技术支持，在多款手机APP中得到

05

模型压缩：量化、剪枝和蒸馏

👆关注“博文视点Broadview”，获取更多书讯近年来，BERT 系列模型成了应用最广的预训练语言模型，随着模型性能的提升，其参数规模不断增大，推理速度也急剧提升，导致原始模型必须部署在高端的GPU 显卡上，甚至部分模型需要多块显卡才能正常运行。在移动智能终端品类越发多样的时代，为了让预训练语言模型可以顺利部署在算力和存储空间都受限的移动终端，对预训练语言模型的压缩是必不可少的。本文将介绍针对BERT（以Transformer Block 堆叠而成的深度模型）的压缩方法。 01 BERT模型分析

02

【云+社区年度征文】TinyML实践-2：How TinyML Works？

对于Tensorflow最大需求是能够在桌面系统中训练并运行模型，这种需求影响了很多设计决策，例如为了更低的延迟和更多的功能而增加可执行文件的大小。云端服务器上，RAM以GB为衡量单位，存储空间以TB为单位，几百兆字节的二进制文件通常不是问题。

05

轻量化神经网络综述

深度神经网络模型被广泛应用在图像分类、物体检测等机器视觉任务中，并取得了巨大成功。然而，由于存储空间和功耗的限制，神经网络模型在嵌入式设备上的存储与计算仍然是一个巨大的挑战。

02

轻量化神经网络综述

深度神经网络模型被广泛应用在图像分类、物体检测等机器视觉任务中，并取得了巨大成功。然而，由于存储空间和功耗的限制，神经网络模型在嵌入式设备上的存储与计算仍然是一个巨大的挑战。

05

谷歌开源JPEG编码器Guetzli，压缩35%也能生成高质量图片

谷歌按：“我们通过线上社区的形式，创造了各种新的工具和工业标准。它们所衍生出的服务和产品，旨在为开发者提供更好的线上体验。” 谷歌近日开源了用于数字图像和网络图形的JPEG编码器 Guetzli（ [guɛtsli]，在瑞士德语中被翻译为饼干）。与现有方法相比，它能将高质量图片的大小缩小35%。这就使网站管理员可以使用更少的数据更快地加载网页，此外，它能兼容现有的浏览器、图像处理应用和JPEG标准。从实现的角度来说Guetzli 与Zopfli算法类似，并不需要引入新的格式就能生成更小的PNG和gzip

07

开发 | 谷歌开源JPEG编码器Guetzli，压缩35%也能生成高质量图片

谷歌通过线上社区的形式创造了各种新的工具和工业标准，它们所衍生出的服务和产品旨在为使用者提供更好的线上体验。谷歌近日开源了用于数字图像和网络图形的JPEG编码器 Guetzli（ [guɛtsli]，在瑞士德语中被翻译为饼干）。与现有的方法相比，它能将高质量图片的大小缩小35%。这就使网站管理员可以使用更少的数据更快地加载网页，此外，它能兼容现有的浏览器、图像处理应用和JPEG标准。从实现的角度来说Guetzli 与Zopfli算法类似，并不需要引入新的格式就能生成更小的PNG和gzip文件。与前段时

08

腾讯信息流内容理解算法工程全流程实践

信息流业务基本上伴随着互联网的诞生一起同步发展，不断为互联网用户提供信息来源，从而促进了门户网站的快速发展，比如腾讯网、搜狐、新浪等。

03

深度学习模型压缩与优化加速（Model Compression and Acceleration Overview）

深度学习（Deep Learning）因其计算复杂度或参数冗余，在一些场景和设备上限制了相应的模型部署，需要借助模型压缩、系统优化加速、异构计算等方法突破瓶颈，即分别在算法模型、计算图或算子优化以及硬件加速等层面采取必要的手段：

01

技术解码 | Web端人像分割技术分享

在如今在线会议、网络教学盛行的时代，员工和学生被要求打开摄像头，将自己、居住环境、隐私暴露在公众视野中。背景虚化、虚拟背景应用恰恰可以解决这一问题，而人像分割技术正是背后支撑这些应用的关键技术。有读者可能疑惑，Native环境下的背景虚化、虚拟背景技术已经存在多时了，把它直接迁移到Web端能有多难呢，我们今天就从这个问题出发，展开聊聊。与Native相比 Web端进行实时人像分割有何不同相比于Native端的AI推理任务实现，目前Web端实现时有如下难点：模型轻量：Native端可以在软件包

02

图片一键压缩，支持批量压缩

最近在写项目时用到了很多图片，由于考虑到图片过大会占用许多服务器资源所以就想到了去压缩图片，但是由于图片太多所以用photoshop操作也挺麻烦就找到了一个网站，如下

02

深度学习落地移动端——Q音探歌实践(二)

接上文上一节内容里，我们大致介绍了我们对移动端可用的硬件条件的探索，接下来，我们更专注于介绍一些专注于移动端设备的机器学习框架，以及在Q音探歌，我们接入深度学习服务的一般流程。 4.移动端机器学习框架介绍深度学习算法推断要在移动端落地，需要着重衡量尺寸和性能的限制，同时又要尽可能的提供给用户较好的体验（推断速度足够快）。Q音探歌倾向使用成熟的机器学习框架快速搭建深度学习服务，我们对比了一些专注于为边缘设备带来高效深度学习的框架，包括NCNN, TensorFlow Lite, Pytorch Mobi

01

低功耗计算机视觉技术前沿，四大方向，追求更小、更快、更高效

深度学习在广泛应用于目标检测、分类等计算机视觉任务中。但这些应用往往需要很大的计算量和能耗。例如处理一张图片分类，VGG-16需要做 150亿次计算，而YOLOv3需要执行390亿次计算。

01

【重磅】谷歌正式发布TensorFlowLite，半监督跨平台快速训练ML模型

来源：Google blog 编译：马文 Cecilia 【新智元导读】谷歌宣布推出 TensorFlow Lite，这是 TensorFlow 的针对移动设备和嵌入式设备的轻量级解决方案。这个框架针对机器学习模型的低延迟推理进行了优化，重点是小内存占用和快速性能。利用TensorFlow Lite，即使在半监督的设置下，也可实现在手机端跨平台训练ML模型。今年早些时候，谷歌推出了 Android Wear 2.0，这是“设备上”（on-device）机器学习技术用于智能通讯的第一款产品。这使得基于云的

09

YOLOv7部署加速比5.89，BERT部署加速比6.37，自动化压缩工具实战30+热门AI模型

众所周知，计算机视觉技术（CV）是企业人工智能应用比重最高的领域之一。为降低企业成本，工程师们一直在探索各类模型压缩技术，来产出“更准、更小、更快”的AI模型部署落地。而在自然语言处理领域（NLP）中，随着模型精度的不断提升，模型的规模也越来越大，例如以BERT、GPT为代表的预训练模型等，这成为企业NLP模型部署落地的拦路虎。

02

训练好的深度学习模型原来这样部署的！（干货满满，收藏慢慢看）

当我们辛苦收集数据、数据清洗、搭建环境、训练模型、模型评估测试后，终于可以应用到具体场景，但是，突然发现不知道怎么调用自己的模型，更不清楚怎么去部署模型！

05

【强烈推荐】YOLOv7部署加速590%，BERT部署加速622%，这款开源自动化压缩工具必须收藏！

众所周知，计算机视觉技术（CV）是企业人工智能应用比重最高的领域之一。为降低企业成本，工程师们一直在探索各类模型压缩技术，来产出“更准、更小、更快”的AI模型部署落地。而在自然语言处理领域（NLP）中，随着模型精度的不断提升，模型的规模也越来越大，例如以BERT、GPT为代表的预训练模型等，这成为企业NLP模型部署落地的拦路虎。

03

FastFormers：实现Transformers在CPU上223倍的推理加速

自BERT紧随Transformer诞生以来，几乎在所有与语言相关的任务中都占据着主导地位，无论是问答、情感分析、文本分类还是文本生成。与RNN和LSTM不一样的是，RNN和LSTM的梯度消失问题阻碍了长数据序列的学习，而transformer在所有这些任务上都有更好的准确性。也不像Transformers，RNN和LSTM是不可扩展的，因为它们必须考虑到前一个神经元的输出。

01

如何构建产品化机器学习系统？

为生产而构建的机器学习系统需要有效地培训、部署和更新机器学习模型。在决定每个系统的体系结构时，必须考虑各种因素。这篇博文的部分内容是基于Coursera和GCP(谷歌云平台)关于构建生产机器学习系统的课程。下面，我将列出构建可伸缩机器学习系统时需要考虑的一些问题:

03

YOLO落地部署 | 一文全览YOLOv5最新的剪枝、量化的进展【必读】

本文首发于【集智书童】，白名单账号转载请自觉植入本公众号名片并注明来源，非白名单账号请先申请权限，违者必究。

04

干货 | 携程AI推理性能的自动化优化实践

携程度假AI研发团队致力于为携程旅游事业部提供丰富的AI技术产品，其中性能优化组为AI模型提供全方位的优化方案，提升推理性能降低成本，实现AI技术在旅游场景的成功落地。

04

TinyML-4：（Quantization）为什么int8足够用于ML

当神经网络最初被开发时，最大的挑战是使它们能够工作！这意味着训练期间的准确性和速度是重中之重。使用浮点算术是保持精度的最简单方法，并且GPU具备完善的设备来加速这些计算，因此自然不会对其他数字格式给予太多关注。

05

四篇NeurIPS 2019论文，快手特效中的模型压缩了解一下

在即将过去的 2019 年中，快手西雅图实验室在 ICLR、CVPR、AISTATS、ICML 和 NeurIPS 等顶会上发表了十多篇论文。

01

音视频编码格式详解

音视频编码格式指的是将音频和视频数据进行压缩、编码和封装的技术，使其在数字通信、存储和传输中更加高效。音视频编码格式可以分为两个部分：编码标准和容器格式。

讲解YOLOv5模型剪枝压缩

目前，深度学习模型的部署和应用已经成为了各个领域的热门话题。然而，随着深度学习模型的不断发展，模型的复杂性和计算需求也越来越高，限制了模型在资源受限的设备上的应用。为了解决这个问题，模型剪枝压缩成为了一种常用的方法。在本文中，我们将讲解如何使用YOLOv5模型进行剪枝压缩，以实现模型的高效部署。

01

《Scikit-Learn、Keras与TensorFlow机器学习实用指南（第二版）》第19章规模化训练和部署TensorFlow模型

有了能做出惊人预测的模型之后，要做什么呢？当然是部署生产了。这只要用模型运行一批数据就成，可能需要写一个脚本让模型每夜都跑着。但是，现实通常会更复杂。系统基础组件都可能需要这个模型用于实时数据，这种情况需要将模型包装成网络服务：这样的话，任何组件都可以通过REST API询问模型。随着时间的推移，你需要用新数据重新训练模型，更新生产版本。必须处理好模型版本，平稳地过渡到新版本，碰到问题的话需要回滚，也许要并行运行多个版本做AB测试。如果产品很成功，你的服务可能每秒会有大量查询，系统必须提升负载能力。提升负载能力的方法之一，是使用TF Serving，通过自己的硬件或通过云服务，比如Google Cloud API平台。TF Serving能高效服务化模型，优雅处理模型过渡，等等。如果使用云平台，还能获得其它功能，比如强大的监督工具。

02

模型部署优化的学习路线是什么？

模型部署优化这个方向其实比较宽泛。从模型完成训练，到最终将模型部署到实际硬件上，整个流程中会涉及到很多不同层面的工作，每一个环节对技术点的要求也不尽相同。

05

PaddlePaddle升级解读 |PaddleSlim为你的模型瘦身

WAVE SUMMIT 2019 深度学习开发者峰会上，PaddleSlim 全新发布，对于在内存紧张、功耗限制、存储有限的设备上进行深度学习应用的开发者是一份重磅惊喜。

04

精度无损，体积压缩70%以上，百度PaddleSlim为你的模型瘦身

PaddleSlim 是一个无论是新手还是经验者都可以很方便用来优化模型以进行部署的模型压缩库：在普通的模型训练上，只需要两行 python 代码，构造一个 Compressor 对象，即可调用。PaddleSlim 实现了目前主流的网络量化、剪枝、蒸馏三种压缩策略，并可快速配置多种压缩策略组合使用。针对体积已经很小的 MobileNet 模型，在模型效果不损失的前提下实现 70% 以上的体积压缩。

02

探索现代图片格式：从GIF到HEIF，优势与适用场景一览

每个像素所能显示的彩色数为2的8次方，即256种颜色。这种彩色深度适用于较古老的显示设备和简单的图像场景。它在色彩表现方面相对较弱，颜色过渡可能显得不够平滑，导致图像呈现出颗粒感，不适合表现细腻的色彩变化。

01

FLiCR：基于有损 RI 的快速轻量级激光雷达点云压缩

文章：FLiCR: A Fast and Lightweight LiDAR Point Cloud Compression Based on Lossy RI

01

十款性能最佳的压缩算法

数据压缩是保留相同或绝大部分数据前提下减小文件大小的过程。它的原理是消除不必要的数据或以更高效的格式重新组织数据。在进行数据压缩时，你可以选择使用有损方法或无损方法。有损方法会永久性地擦除掉一些数据，而无损方法则能保证持有全部的数据。使用哪类方法取决于你要让你的文件保持多大的精准度。

01

AIoT应用创新大赛-基于TencentOS Tiny 的多功能行人检测仪

大家好，很高兴能够参与这次腾讯云AIoT应用创新大赛，非常希望能够在这次比赛中得到收获与提升，同时也希望能够通过这次比赛能与各位交流学习。

自动模型压缩与架构搜索，这是飞桨PaddleSlim最全的解读

近年来，深度学习技术在很多方向都取得了巨大的成功，但由于深度神经网络计算复杂度高，模型参数量大，限制了其在一些场景和设备上进行部署，特别是在移动嵌入式设备的部署。因此，模型小型化技术成为最近几年学术界和工业界研究的热点，模型小型化技术也从最开始的网络剪枝、知识蒸馏、参数量化等发展为最新的神经网络架构搜索（NAS）和自动模型压缩等技术。

01

自动模型压缩与架构搜索，这是飞桨PaddleSlim最全的解读

近年来，深度学习技术在很多方向都取得了巨大的成功，但由于深度神经网络计算复杂度高，模型参数量大，限制了其在一些场景和设备上进行部署，特别是在移动嵌入式设备的部署。因此，模型小型化技术成为最近几年学术界和工业界研究的热点，模型小型化技术也从最开始的网络剪枝、知识蒸馏、参数量化等发展为最新的神经网络架构搜索（NAS）和自动模型压缩等技术。

02

深度学习算法优化系列五 | 使用TensorFlow-Lite对LeNet进行训练后量化

在深度学习算法优化系列三 | Google CVPR2018 int8量化算法这篇推文中已经详细介绍了Google提出的Min-Max量化方式，关于原理这一小节就不再赘述了，感兴趣的去看一下那篇推文即可。今天主要是利用tflite来跑一下这个量化算法，量化一个最简单的LeNet-5模型来说明一下量化的有效性。tflite全称为TensorFlow Lite，是一种用于设备端推断的开源深度学习框架。中文官方地址我放附录了，我们理解为这个框架可以把我们用tensorflow训练出来的模型转换到移动端进行部署即可，在这个转换过程中就可以自动调用算法执行模型剪枝，模型量化了。由于我并不熟悉将tflite模型放到Android端进行测试的过程，所以我将tflite模型直接在PC上进行了测试（包括精度，速度，模型大小）。

01

深度学习模型压缩（剪枝、量化、哈夫曼编码）

剪枝的思路在工程上是一种非常常见的思路，比如前面我们介绍决策树训练的时候就有提到过用剪枝来防止过拟合，在这里我们同样采用这样一种思路，来删除收益过低的一些计算成本。

07

模型压缩：CNN和Transformer通用，修剪后精度几乎无损，速度提升40%

计算机视觉研究院主要涉及AI研究和落地实践，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架，提供论文一键下载，并分享实战项目。研究院主要着重”技术研究“和“实践落地”！

00

精度 VS 效率：模型越小，精度就一定越低吗？

以下是我最近在伦敦 O’Reilly AI Conference 和 DroidCon 上的两次谈话的改编。

01

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭