开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

如何使用tensorflow减少预测期间的内存消耗？

在使用TensorFlow减少预测期间的内存消耗时，可以采取以下几种方法：

使用低精度数据类型：在预测期间，可以将模型中的权重和激活值转换为低精度数据类型，如float16或int8。这样可以减少内存占用，并加快计算速度。TensorFlow提供了相应的API来支持低精度计算。
使用图模式：TensorFlow的默认执行模式是Eager Execution（即即时执行模式），它会在每次预测时构建计算图。而使用图模式可以将计算图构建在预测之前，然后重复使用该图进行多次预测。这样可以减少内存消耗，提高预测性能。
批量预测：将多个样本一起输入模型进行预测，而不是逐个样本进行预测。这样可以利用并行计算的优势，减少内存消耗和预测时间。
内存优化：在预测期间，可以通过设置TensorFlow的配置参数来优化内存使用。例如，可以限制GPU内存的使用量，或者使用TensorFlow的内存优化工具来减少内存碎片化。
模型剪枝和量化：通过模型剪枝和量化技术，可以减少模型的参数量和计算量，从而降低内存消耗。可以使用TensorFlow提供的剪枝和量化工具来实现。

总结起来，使用TensorFlow减少预测期间的内存消耗可以通过使用低精度数据类型、图模式、批量预测、内存优化以及模型剪枝和量化等方法来实现。这些方法可以提高预测性能，减少内存占用，并且不需要依赖特定的云计算品牌商。

相关搜索:减少PowerShell脚本的内存消耗如何减少默认的C++内存消耗？服务器减少内存的消耗 iPhone + UIView.drawRect期间的内存消耗量很大.减少这个的任何策略？使用Tensorflow keras.Sequential()在预测期间激活丢失如何减少内存的使用？如何使用tensorflow打印预测如何减少Cobalt的内存使用如何使用tensorflow进行简单预测 Tensorflow:如何减少仅用于推理模型的内存占用？单独的实体是否有助于减少内存消耗？(实体框架)如何减少Eclipse Ganymede的内存使用？如何减少tensorflow模型的误差？如何在tensorflow js中使用预测使用tcpserversink的内存消耗正在增加 Tensorflow:如何获得正确的预测？如何序列化Tensorflow服务请求以减少推断/预测延迟？使用Voip和启用的定位服务减少电池消耗有效地索引矩阵并减少对CoopGame包的内存消耗如何使用tensorflow模型预测我自己的图像

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

比谷歌快46倍！GPU助力IBM Snap ML，40亿样本训练模型仅需91.5 秒

【新智元导读】近日，IBM 宣布他们使用一组由 Criteo Labs发布的广告数据集来训练逻辑回归分类器，在POWER9服务器和GPU上运行自身机器学习库Snap ML，结果比此前来自谷歌的最佳成绩快了46倍。英伟达CEO黄仁勋和IBM 高级副总裁John Kelly在Think大会上最近，在拉斯维加斯的IBM THINK大会上，IBM宣布，他们利用优化的硬件上的新软件和算法，取得了AI性能的大突破，包括采用 POWER9 和NVIDIA®V100™GPU 的组合。谷歌云上TensorF

教程 | 教Alexa看懂手语，不说话也能控制语音助手

数月前的某个夜晚，我躺在床上时，一个念头闪过我的脑海——「如果语音是计算接口的未来，那么那些听不见或看不见的人该怎么办？」我不知道究竟是什么触发了这个想法。我自己能听、能说，周围也没有聋哑人，而且我也没有语音助手。也许是因为无数语音助理方面的文章突然出现，也许是因为各大公司争相让你选择它们的语音助手产品，或许只是因为经常在朋友的桌上看到这些设备。由于这个问题无法从记忆中消失，我知道我需要仔细考虑它。

02

【业界】Booking.com如何使用Kubernetes进行机器学习

AiTechYun 编辑：nanan 在今年的QCon伦敦会议上，Booking.com的开发者Sahil Dua介绍了他们是如何使用Kubernetes为他们的客户推荐目的地和住宿的机器学习(ML)

03

如何确保机器学习最重要的起始步骤"特征工程"的步骤一致性？

关于特征工程，业界有这么一句话：数据和特征决定了机器学习的上限，而模型和算法只是逼近这个上限。

02

如何确保机器学习最重要的起始步骤"特征工程"的步骤一致性？

关于特征工程，业界有这么一句话：数据和特征决定了机器学习的上限，而模型和算法只是逼近这个上限。

02

TensorFlow下构建高性能神经网络模型的最佳实践

作者 | 李嘉璇责编 | 何永灿随着神经网络算法在图像、语音等领域都大幅度超越传统算法，但在应用到实际项目中却面临两个问题：计算量巨大及模型体积过大，不利于移动端和嵌入式的场景；模型内存占用过大，导致功耗和电量消耗过高。因此，如何对神经网络模型进行优化，在尽可能不损失精度的情况下，减小模型的体积，并且计算量也降低，就是我们将深度学习在更广泛的场景下应用时要解决的问题。加速神经网络模型计算的方向在移动端或者嵌入式设备上应用深度学习，有两种方式：一是将模型运行在云端服务器上，向服务器发送请求，接收服务器

02

如何构建产品化机器学习系统？

为生产而构建的机器学习系统需要有效地培训、部署和更新机器学习模型。在决定每个系统的体系结构时，必须考虑各种因素。这篇博文的部分内容是基于Coursera和GCP(谷歌云平台)关于构建生产机器学习系统的课程。下面，我将列出构建可伸缩机器学习系统时需要考虑的一些问题:

03

2万元「煤气灶」Titan RTX做深度学习？机器之心为读者们做了个评测

2018 年 12 月，英伟达在加拿大蒙特利尔 NeurIPS 大会上发布最新款产品 Titan RTX，作为 2017 年 Titan V 的「继承者」，Titan RTX 价格更低，显存更大，性能更强，且使用图灵架构，具备强大的光线追踪能力。因此，Titan RTX 的发布对 AI 社区而言，是不是做深度学习的一个不错选择呢？

05

2017图灵奖得主：通用芯片每年仅提升3%，神经专用架构才是未来

作者：Norman P. Jouppi, Cliff Young, Nishant Patil, David Patterson

02

LiRank: LinkedIn在2月新发布的大规模在线排名模型

LiRank是LinkedIn在2月份刚刚发布的论文，它结合了最先进的建模架构和优化技术，包括残差DCN、密集门控模块和Transformers。它引入了新的校准方法，并使用基于深度学习的探索/利用策略来优化模型，并且通过压缩技术，如量化和词表压缩，实现了高效部署。

01

深度学习落地移动端——Q音探歌实践(二)

接上文上一节内容里，我们大致介绍了我们对移动端可用的硬件条件的探索，接下来，我们更专注于介绍一些专注于移动端设备的机器学习框架，以及在Q音探歌，我们接入深度学习服务的一般流程。 4.移动端机器学习框架介绍深度学习算法推断要在移动端落地，需要着重衡量尺寸和性能的限制，同时又要尽可能的提供给用户较好的体验（推断速度足够快）。Q音探歌倾向使用成熟的机器学习框架快速搭建深度学习服务，我们对比了一些专注于为边缘设备带来高效深度学习的框架，包括NCNN, TensorFlow Lite, Pytorch Mobi

01

降龙十八掌：这套优化transformer内存占用的组合技值得收藏

峰值内存消耗是训练深度学习模型（如视觉 Transformer 和 LLM）时的常见瓶颈。本文提供了一系列可以在不牺牲建模性能和预测精度的情况下，将 PyTorch 中的内存消耗降低到约 1/20 的技术。

02

《Scikit-Learn、Keras与TensorFlow机器学习实用指南（第二版）》第19章规模化训练和部署TensorFlow模型

有了能做出惊人预测的模型之后，要做什么呢？当然是部署生产了。这只要用模型运行一批数据就成，可能需要写一个脚本让模型每夜都跑着。但是，现实通常会更复杂。系统基础组件都可能需要这个模型用于实时数据，这种情况需要将模型包装成网络服务：这样的话，任何组件都可以通过REST API询问模型。随着时间的推移，你需要用新数据重新训练模型，更新生产版本。必须处理好模型版本，平稳地过渡到新版本，碰到问题的话需要回滚，也许要并行运行多个版本做AB测试。如果产品很成功，你的服务可能每秒会有大量查询，系统必须提升负载能力。提升负载能力的方法之一，是使用TF Serving，通过自己的硬件或通过云服务，比如Google Cloud API平台。TF Serving能高效服务化模型，优雅处理模型过渡，等等。如果使用云平台，还能获得其它功能，比如强大的监督工具。

02

TensorFlow Lite在Kika Keyboard中的应用案例分享

『基于 AI 技术变革沟通，让世界沟通更简单』一直是 Kika keyboard 最重要的使命。从2016年开始，Kika 技术团队一直致力于 AI 技术在移动端落地，尤其是在 keyboard 输入法引擎做了很多算法与工程上的探索工作。2017 年 5 月，Kika 技术团队基于 TensorFlow Mobile 研发了 Kika AI Engine，将其应用于 Kika 的全系输入法产品中。2017 年 11 月，Google 发布 TensorFlow Lite (TF Lite) 后，Kika 技术团队迅速进行了跟进，并于 2018 年 1 月成功地开发了基于 TF Lite 全新一代的 Kika AI Engine，同时进行了线上产品的更新。

04

观点 | 为什么 AI 芯片时代必然到来——从 TPU 开始的几十倍性能之旅

AI 科技评论按：ACM 通讯（ACM Communications）在线杂志近期刊登了一篇作者来自谷歌的文章，带领我们重新审视了近几十年的半导体发展历程，以及 AI 研究、应用人员们如今已经接受了的问题：专用处理器为什么好、为什么火起来。值得注意的是，这篇文章的作者之一正是谷歌 TPU 团队成员、UC 伯克利大学退休教授、2017 年图灵奖获得者 David Patterson。AI 科技评论全文编译如下。

02

垃圾收集分析的意义

在不断发展的软件开发领域，性能是至关重要的。应用程序的效率可以决定其成功与否，而在优化软件性能方面发挥关键作用的关键元素之一是垃圾收集（GC）。这是一个确保内存有效分配和回收的过程，从而防止内存泄漏并增强应用程序可靠性。

02

TensorFlow AI 新品联手NVIDIA，支持Swift和JavaScript

整理 | 费棋天体物理学家使用 TensorFlow 分析开普勒任务中的大量数据，以发现新的行星；医学研究人员利用 TensorFlow 机器学习技术来评估一个人心脏病发作和中风的几率；科学家在非洲用 TensorFlow 检测木薯植物疾病，从而提高产量并帮助更好地满足非洲大陆的粮食需求； …… 这是 TensorFlow 团队对过去一年来的总结，他们在诸多领域取得了进步。北京时间 3 月 31 日凌晨，第二届 TensorFlow 开发者峰会开幕， TensorFlow 团队发布了多款新产品，

06

TensorFlow AI 新品更易用！联手NVIDIA，支持Swift和JavaScript

整理 | 费棋天体物理学家使用 TensorFlow 分析开普勒任务中的大量数据，以发现新的行星；医学研究人员利用 TensorFlow 机器学习技术来评估一个人心脏病发作和中风的几率；科学家在非洲用 TensorFlow 检测木薯植物疾病，从而提高产量并帮助更好地满足非洲大陆的粮食需求； …… 这是 TensorFlow 团队对过去一年来的总结，他们在诸多领域取得了进步。北京时间 3 月 31 日凌晨，第二届 TensorFlow 开发者峰会开幕， TensorFlow 团队发布了多款新产品，

TensorFlow第二届开发者峰会

天体物理学家使用 TensorFlow 分析开普勒任务中的大量数据，以发现新的行星；医学研究人员利用 TensorFlow 机器学习技术来评估一个人心脏病发作和中风的几率；科学家在非洲用 TensorFlow 检测木薯植物疾病，从而提高产量并帮助更好地满足非洲大陆的粮食需求； …… 这是 TensorFlow 团队对过去一年来的总结，他们在诸多领域取得了进步。北京时间 3 月 31 日凌晨，第二届 TensorFlow 开发者峰会开幕， TensorFlow 团队发布了多款新产品，旨在使开发者更易使用，以及让数据科学家使用多种方式构建 AI 模型。

03

在 Python 中使用 Tensorflow 预测燃油效率

预测燃油效率对于优化车辆性能和减少碳排放至关重要，这可以使用python库tensorflow进行预测。在本文中，我们将探讨如何利用流行的机器学习库 Tensorflow 的强大功能来使用 Python 预测燃油效率。通过基于 Auto MPG 数据集构建预测模型，我们可以准确估计车辆的燃油效率。让我们深入了解在 Python 中使用 Tensorflow 进行准确的燃油效率预测的过程。

02

卷积神经网络

为什么要用3x3卷积？偶数卷积核其实表现更强 | NeurIPS 2019

当前紧凑的卷积神经网络主要通道深度可分离卷积，扩张通道和复杂的拓扑结构来提高效率，但这也反过来加重了训练过程。此外，在这些模型中3*3卷积核占主要地位，而偶数大小的卷积核(2*2,4*4)很少被采用。

03

Google正式发布TensorFlow Lite预览版，针对移动/嵌入设备的轻量级解决方案

AI科技评论消息，日前，谷歌正式发布 TensorFlow Lite 开发者预览版，这是针对移动和嵌入式设备的轻量级解决方案。TensorFlow Lite 是一种全新的设计，具有三个重要特征——轻量级（Lightweight）、跨平台（Cross-platform）、快速（Fast）。下面是来自 Google Developers Blog 的详细信息，AI科技评论编译如下。谷歌于今天正式发布 TensorFlow Lite 开发者预览版，这是针对移动和嵌入式设备的轻量级解决方案。TensorFlow

07

寻找最佳的神经网络架构，韩松组两篇论文解读

第二篇则是利用强化学习自动寻找在特定 latency 标准上精度最好的量化神经网络结构，它分别为网络的每一层搜索不同 bit 的权值和激活，得到一个经过优化的混合精度模型。两篇文章的相同之处在于，都直接从特定的硬件获得反馈信息，如 latency，energy 和 storage，而不是使用代理信息，再利用这些信息直接优化神经网络架构 (或量化 bit 数) 搜索算法。这也许会成为工业界未来的新范式。

01

炸裂！轻量化YOLO | ShuffleNetv2与Transformer结合，重塑YOLOv7成就超轻超快YOLO

随着计算机视觉领域的迅速发展，目标检测在各种应用中变得至关重要，这些应用范围包括但不限于安全监控、自动驾驶和智慧医疗。尽管传统目标检测方法存在计算复杂度高和实时性能不足的问题，但基于深度学习算法已在准确性和实时性能方面取得了重大突破。其中，YOLO已成为一种经典的实时目标检测算法，它在计算速度和检测精度之间取得了平衡。然而，移动设备通常在计算能力、内存容量和能源消耗方面受限，这复杂化了深度学习模型的部署。

03

TensorFlow-dev-summit：那些TensorFlow上好玩的和黑科技

本文属于介绍性文章，其中会介绍许多TensorFlow的新feature和summit上介绍的一些有意思的案例，文章比较长，可能会花费30分钟到一个小时

02

【翻译】Efficient Data Loader for Fast Sampling-Based GNN Training on Large Graphs

Efficient Data Loader for Fast Sampling-Based GNN Training on Large Graphs | IEEE Journals & Magazine | IEEE Xplore

04

Apache Hudi与机器学习特征存储

如果在训练和推理系统中特征工程代码不相同，则存在代码不一致的风险，因此，预测可能不可靠，因为特征可能不相同。一种解决方案是让特征工程作业将特征据写入在线和离线数据库。训练和推理应用程序在做出预测时都需要读取特征-在线应用可能需要低延迟（实时）访问该特征数据，另一种解决方案是使用共享特征工程库（在线应用程序和训练应用程序使用相同的共享库）。

02

提速20倍！谷歌AI发布TensorFlow 3D，智能汽车场景亲测好用

随着自动驾驶汽车与机器人的深入发展，激光雷达、深度传感摄像机、雷达等3D传感器已经成为了获取道路数据的必要设备。

02

精度 VS 效率：模型越小，精度就一定越低吗？

以下是我最近在伦敦 O’Reilly AI Conference 和 DroidCon 上的两次谈话的改编。

01

ChatGPT专题|做出ChatGPT的OpenAI，是如何打破英伟达在机器学习领域的垄断地位的？

在机器学习领域，无论是硬件还是软件，英伟达无疑均拥有巨大优势，后者用 CUDA 建立起了一道软件的护城河。可惜的是，这家公司缺乏远见，未能利用其在机器学习硬软件方面的巨大优势，让自己成为机器学习默认的编译器。而它对可用性与易用性的忽视，让 OpenAI 与 Meta 得以趁虚而入，其主导地位正在被打破。

02

512块A100，AlphaFold训练时间从11天压缩至67小时：尤洋团队FastFold上线

机器之心报道编辑：小舟、蛋酱 AlphaFold 虽好，但耗时且成本高，现在首个用于蛋白质结构预测模型的性能优化方案来了。蛋白质结构预测一直是结构生物学中的一个重要的研究问题。直接从蛋白质的氨基酸序列预测蛋白质的三维结构在许多领域都有广泛的应用，包括药物设计、蛋白质设计等。预测蛋白质结构的方法主要有两种：实验方法和计算方法。实验方法需要以高昂的时间和经济成本获得更准确的蛋白质结构。计算方法则能够以低成本高吞吐量预测蛋白质结构，因此提高计算方法的预测精度至关重要。借助深度神经网络，AlphaFold

04

MLOps：构建生产机器学习系统的最佳实践

你可能已经听过很多次了，但只有一小部分机器学习模型投入生产。部署和运行机器学习模型对于大多数已经开始将ML应用于用例的行业来说都是一个挑战。在这篇文章中，我将分享一些MLOps的最佳实践和技巧，它们将允许您在生产环境中使用您的ML模型并正确地操作它。在我们开始之前，让我们讨论一下我们可能都知道的典型的ML项目生命周期。

02

512块A100，AlphaFold训练时间从11天压缩至67小时：尤洋团队FastFold上线

关注并星标从此不迷路计算机视觉研究院公众号ID｜ComputerVisionGzq 学习群｜扫码在主页获取加入方式计算机视觉研究院专栏作者：Edison_G AlphaFold 虽好，但耗时且成本高，现在首个用于蛋白质结构预测模型的性能优化方案来了。机器之心报道蛋白质结构预测一直是结构生物学中的一个重要的研究问题。直接从蛋白质的氨基酸序列预测蛋白质的三维结构在许多领域都有广泛的应用，包括药物设计、蛋白质设计等。预测蛋白质结构的方法主要有两种：实验方法和计算方法。实验方法需要以高昂

03

TensorFlow从1到2（十五）（完结）在浏览器做机器学习

TensorFlow一直努力扩展自己的基础平台环境，除了熟悉的Python，当前的TensorFlow还实现了支持Javascript/C++/Java/Go/Swift(预发布版)共6种语言。越来越多的普通程序员，可以容易的在自己工作的环境加入机器学习特征，让产品更智能。

02

使用CNN预测电池寿命

作者 | Hannes Knobloch 来源 | codeingschool 编辑 | 代码医生团队可以在GitHub上找到这个项目的源代码： https://github.com/dsr-18/

04

干货 | 想在手机上用自己的ML模型？谷歌模型压缩包你满意

谷歌在 Google AI 上撰文进行对刚刚发布的 ML Kit 中的核心技术：Learn2Compress 自动模型压缩技术进行了详细介绍和实战测试。

02

《Scikit-Learn与TensorFlow机器学习实用指南》第13章卷积神经网络

（第一部分机器学习基础）第01章机器学习概览第02章一个完整的机器学习项目（上）第02章一个完整的机器学习项目（下）第03章分类第04章训练模型第05章支持向量机第06章决策树第07章集成学习和随机森林第08章降维（第二部分神经网络和深度学习）第9章启动和运行TensorFlow 第10章人工神经网络第11章训练深度神经网络（上）第11章训练深度神经网络（下）第12章设备和服务器上的分布式 TensorFlow 第13章卷积神经网络

01

学习笔记TF066 : TensorFlow 移动端应用，iOS、Android系统实践

TensorFlow对Android、iOS、树莓派都提供移动端支持。移动端应用原理。移动端、嵌入式设备应用深度学习方式，一模型运行在云端服务器，向服务器发送请求，接收服务器响应；二在本地运行模型，

00

和TensorFlow一样，英伟达CUDA的垄断格局将被打破？

选自semianalysis.com 作者：Dylan Patel 机器之心编译机器之心编辑部 CUDA 闭源库将和 TensorFlow 一样逐渐式微。十年来，机器学习软件开发的格局发生了重大变化。许多框架如雨后春笋般涌现，但大多数都严重依赖于英伟达的 CUDA，并在英伟达的 GPU 上才能获得最佳的性能。然而，随着 PyTorch 2.0 和 OpenAI Triton 的到来，英伟达在这一领域的主导地位正在被打破。谷歌早期在机器学习模型架构、训练、模型优化方面都具有很大优势，但现在却难以充分发挥

01

DeepLab2：用于深度标记的TensorFlow库(2021)

[paper]DeepLab2: A TensorFlow Library for Deep Labeling [code]DeepLab2: A TensorFLow Library for Deep Labeling DeepLab2 是一个用于深度标注的 TensorFlow 库，旨在为密集像素标注任务提供统一的、最先进的 TensorFlow 代码库，包括但不限于语义分割、实例分割、全景分割、深度估计，甚至视频全景分割。

01

想在手机上用自己的 ML 模型？谷歌模型压缩包你满意

AI 研习社按： Google I/O 2018 上，谷歌发布了可供开发者定制移动端机器学习模型的 ML Kit 开发套件，关于该套件中的核心技术：Learn2Compress 模型压缩技术，谷歌也火速在 Google AI 上撰文对其进行了详细介绍和实战测试，AI 研习社将其内容编译如下。

01

《Scikit-Learn与TensorFlow机器学习实用指南》第13章卷积神经网络

第13章卷积神经网络来源：ApacheCN《Sklearn 与 TensorFlow 机器学习实用指南》翻译项目译者：@akonwang @WilsonQu 校对： @飞龙尽管 IBM 的深蓝超级计算机在1996年击败了国际象棋世界冠军 Garry Kasparvo，直到近几年计算机都不能可靠地完成一些看起来较为复杂的任务，比如判别照片中是否有狗以及识别语音。为什么这些任务对于人类而言如此简单？答案在于感知主要发生在我们意识领域之外，在我们大脑中的专门视觉，听觉和其他感官模块内。当感官信

ERNIE时延降低81.3%，飞桨原生推理库Paddle Inference再升级

随着深度学习技术的成熟和人工智能的发展，机器开始变得越来越“聪明”，越来越了解用户的喜好和习惯。

02

谷歌开源基于TensorFlow的通用框架AdaNet，快速且易于使用

Ensemble learning结合不同机器学习模型预测，被广泛用于神经网络以实现最先进的性能，得益于丰富的历史和理论保证，成功的挑战，如Netflix奖和各种Kaggle竞赛。然而，由于训练时间长，它们在实践中使用不多，机器学习模型候选者选择需要其自己的领域专业知识。但随着计算能力和专用深度学习硬件（如TPU）变得越来越容易获得，机器学习模型将变得更大，整体效果将变得更加突出。现在，想象一个工具可以自动搜索神经架构，并学会将最好的架构组合成一个高质量的模型。

02

使用TensorFlow动手实现的简单的股价预测模型

本文是一个通过模拟预测股票，教会大家如何动手操作TensorFlow的教程，结果不具有权威性。因为股票价格的实际预测是一项非常复杂的任务，尤其是像本文这种按分钟的预测。导入并预处理数据我们的团队从我们的抓取服务器中的数据并csv格式的保存。数据集包含n = 41266分钟的数据，从2017年4月到8月，500只股票，以及标准普尔500指数成份股。指数和股票以宽格式排列。数据集：http://files.statworx.com/sp500.zip # Import data data= pd.read

06

PyTorch、TensorFlow最新版本对比，2021年了你选谁？

自深度学习重新获得公认以来，许多机器学习框架层出不穷，争相成为研究人员以及行业从业人员的新宠。从早期的学术成果 Caffe、Theano，到获得庞大工业支持的 PyTorch、TensorFlow，许多研究者面对大量的学习框架不知该如何选择？

06

专访 | 基于LSTM与TensorFlow Lite，kika输入法是如何造就的

机器之心原创作者：思源近日，机器之心采访了 kika 的高级技术总监黄康，他向我们讲述了 kika 开发输入法 AI 引擎（项目代号：Alps）所采用的深度学习模型以及在移动端轻量化部署遇到的各种挑战。本文从输入法与语言模型开始介绍了 kika Alps 项目的理论支持与实践挑战，并重点讨论了轻量化部署方法。深度学习模型由于强大的表征能力在很多任务上都有非常优秀的表现，但也因为模型大小和计算量很难轻量化部署到移动端。这也是目前很多研发团队都在思考如何解决的难题。一般在我们借助 TensorFlow、

05

处理人工智能任务必须知道的11个Python库

Python对数据科学如此重要的原因之一是它海量的数据分析和可视化库。在本文中，我们讨论了最受欢迎的一些。

02

[论文翻译] 分布式训练 Parameter sharding 之 ZeRO

Parameter sharding 就是把模型参数等切分到各个GPU之上，以此达到使用较少GPU实现大规模模型训练的目的。本系列会以 Google，微软和Facebook的论文，博客以及代码来对parameter sharding 进行分析，大约有 5～6篇文章。

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭