开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

了解tensorflow中的设备分配、并行性(tf.while_loop)和tf.function

在TensorFlow中，设备分配、并行性和tf.function是提高模型性能和效率的关键概念。下面，我将逐一解释这些概念，并说明它们如何在TensorFlow中使用。

1. 设备分配

TensorFlow支持在不同的设备上运行计算，如CPU、GPU和TPU。你可以显式指定操作应该在哪个设备上执行。这可以通过tf.device上下文管理器来实现：

import tensorflow as tf

# 指定操作在CPU上执行
with tf.device('/CPU:0'):
    a = tf.constant([1.0, 2.0, 3.0])

# 指定操作在GPU上执行
with tf.device('/GPU:0'):
    b = tf.constant([1.0, 2.0, 3.0])
    c = a + b

如果你有多个GPU，可以通过更改设备名称（如/GPU:1）来指定不同的GPU。

2. 并行性（tf.while_loop）

TensorFlow提供了tf.while_loop来执行循环计算，这是一个控制流操作，它允许在图中动态地执行循环。tf.while_loop比Python的原生循环更高效，因为它在构建图时就内置了整个循环结构。此外，它支持并行迭代，可以显著提高性能。

# 计算阶乘的例子
n = tf.constant(5)
i = tf.constant(0)
acc = tf.constant(1)

condition = lambda i, acc: i < n
body = lambda i, acc: (i+1, acc * (i+1))

_, result = tf.while_loop(condition, body, [i, acc])

tf.print(result)  # 输出 120

在tf.while_loop中，你可以通过parallel_iterations参数控制并行迭代的数量，这有助于加速执行。

3. tf.function

tf.function是一个强大的装饰器，它可以将普通的Python函数转换为高效的TensorFlow图操作。这不仅可以提高执行速度，还可以使得函数能够利用TensorFlow的图优化和跨设备执行能力。

@tf.function
def compute_area(radius):
    return 3.141592653589793 * radius ** 2

radius = tf.constant([2.0, 3.0])
area = compute_area(radius)
tf.print(area)  # 输出 [12.566370964050293, 28.274333953857422]

使用tf.function时，TensorFlow会自动将函数中的操作转换为图中的节点，并在调用函数时执行这个图。这种转换是透明的，可以显著提高性能，特别是在复杂的计算中。

总结

设备分配允许你控制操作在哪个硬件上执行，有助于优化性能。
tf.while_loop提供了一种高效的循环执行机制，支持并行处理，适用于处理复杂的迭代计算。
tf.function将Python函数转换为TensorFlow图，提高执行效率，使函数能够利用TensorFlow的优化和设备管理功能。

理解并合理使用这些特性，可以帮助你更好地设计和优化TensorFlow模型和计算过程。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

Autograph的机制原理

而Autograph机制可以将动态图转换成静态计算图，兼收执行效率和编码效率之利。

01

【干货】TensorFlow 2.0官方风格与设计模式指南（附示例代码）

【导读】TensorFlow 1.0并不友好的静态图开发体验使得众多开发者望而却步，而TensorFlow 2.0解决了这个问题。不仅仅是默认开启动态图模式，还引入了大量提升编程体验的新特性。本文通过官方2.0的风格指南来介绍新版本的开发体验。

01

我们期待的TensorFlow 2.0还有哪些变化？

为提高 TensorFlow 的工作效率，TensorFlow 2.0 进行了多项更改，包括删除了多余的 API，使API 更加一致统一，例如统一的 RNNs (循环神经网络），统一的优化器，并且Python 运行时更好地集成了 Eager execution 。

03

[译]高效的TensorFlow 2.0：应用最佳实践以及有什么变化

在最近的一篇文章中，我们提到，TensorFlow 2.0经过重新设计，重点关注开发人员的工作效率、简单性和易用性。

03

我们期待的TensorFlow 2.0还有哪些变化？

为提高 TensorFlow 的工作效率，TensorFlow 2.0 进行了多项更改，包括删除了多余的 API，使API 更加一致统一，例如统一的 RNNs (循环神经网络），统一的优化器，并且Python 运行时更好地集成了 Eager execution 。

06

TensorFlow2.X学习笔记(4)--TensorFlow低阶API之AutoGraph相关研究

而Autograph机制可以将动态图转换成静态计算图，兼收执行效率和编码效率之利。

02

Tensorflow AutoGraph 的作用和功能

TensorFlow AutoGraph 是 TensorFlow 中的一个重要特性，它允许开发者使用普通的 Python 语法编写高效的 TensorFlow 图（graph）。这意味着开发者可以利用 Python 的易用性来编写模型代码，而 AutoGraph 则负责将这些代码转换成高效执行的 Tensorflow 图。这一过程大大简化了机器学习模型的开发和优化过程。

00

TensorFlow 2.9上线：oneDNN改进实现CPU性能优化，WSL2开箱即用

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号机器之心授权 TensorFlow 2.9 已发布，还没有更新的小伙伴现在可以更新了。昨日，TensorFlow 官方宣布：TensorFlow 2.9 来了！距离上次 2.8 版本的更新仅仅过去三个月。新版本亮点包括如下： oneDNN 的性能改进； DTensor 的发布，这是一种新 API，可用于从数据并行无缝迁移到模型并行；对核心库进行了改进，包括 Eigen、tf.function 统一以及对 Windows 的 WSL2 的新支持

02

TensorFlow 2.9上线：oneDNN改进实现CPU性能优化，WSL2开箱即用

机器之心报道编辑：陈萍、杜伟 TensorFlow 2.9 已发布，还没有更新的小伙伴现在可以更新了。昨日，TensorFlow 官方宣布：TensorFlow 2.9 来了！距离上次 2.8 版本的更新仅仅过去三个月。新版本亮点包括如下： oneDNN 的性能改进； DTensor 的发布，这是一种新 API，可用于从数据并行无缝迁移到模型并行；对核心库进行了改进，包括 Eigen、tf.function 统一以及对 Windows 的 WSL2 的新支持；还为 tf.function ret

02

TensorFlow 2.0 的新增功能：第三、四部分

如果您使用过 TensorFlow 1.x，则本部分将重点介绍迁移到 TensorFlow 2.0 所需的总体概念更改。它还将教您使用 TensorFlow 可以进行的各种 AIY 项目。最后，本节向您展示如何将 TensorFlow Lite 与跨多个平台的低功耗设备一起使用。

02

tf.while_loop

cond是一个返回布尔标量张量的可调用的张量。body是一个可调用的变量，返回一个(可能是嵌套的)元组、命名元组或一个与loop_vars具有相同特性(长度和结构)和类型的张量列表。loop_vars是一个(可能是嵌套的)元组、命名元组或张量列表，它同时传递给cond和body。cond和body都接受与loop_vars一样多的参数。除了常规张量或索引片之外，主体还可以接受和返回TensorArray对象。TensorArray对象的流将在循环之间和梯度计算期间适当地转发。注意while循环只调用cond和body一次(在调用while循环的内部调用，而在Session.run()期间根本不调用)。while loop使用一些额外的图形节点将cond和body调用期间创建的图形片段拼接在一起，创建一个图形流，该流重复body，直到cond返回false。为了保证正确性，tf.while循环()严格地对循环变量强制执行形状不变量。形状不变量是一个(可能是部分的)形状，它在循环的迭代过程中保持不变。如果循环变量的形状在迭代后被确定为比其形状不变量更一般或与之不相容，则会引发错误。例如，[11,None]的形状比[11,17]的形状更通用，而且[11,21]与[11,17]不兼容。默认情况下(如果参数shape_constant没有指定)，假定loop_vars中的每个张量的初始形状在每次迭代中都是相同的。shape_constant参数允许调用者为每个循环变量指定一个不太特定的形状变量，如果形状在迭代之间发生变化，则需要使用该变量。tf.Tensor。体函数中也可以使用set_shape函数来指示输出循环变量具有特定的形状。稀疏张量和转位切片的形状不变式特别处理如下:

04

TensorFlow和PyTorch的实际应用比较

TensorFlow和PyTorch是两个最受欢迎的开源深度学习框架，这两个框架都为构建和训练深度学习模型提供了广泛的功能，并已被研发社区广泛采用。但是作为用户，我们一直想知道哪种框架最适合我们自己特定项目，所以在本文与其他文章的特性的对比不同，我们将以实际应用出发，从性能、可伸缩性和其他高级特性方面比较TensorFlow和PyTorch。

03

[翻译] TensorFlow 分布式之论文篇 "Implementation of Control Flow in TensorFlow"

读论文有一种原则是：本领域最经典的论文，近5年最热的论文，近1年最新的论文。按照这个原则，本文主要介绍一篇Tensorflow 经典论文 Implementation of Control Flow in TensorFlow。

01

[源码解析] TensorFlow 分布式之 ParameterServerStrategy V2

对于 ParameterServerStrategy V2，我们将从几个方面来研究：如何与集群建立连接，如何生成变量，如何获取数据，如何运行。其中，变量和作用域我们在前文已经研究过，运行在 MirroredStrategy 里面也介绍，所以本文主要看看如何使用，如何初始化。在下一篇之中会重点看看如何分发计算。

02

TensorFlow2.X学习笔记(1)--TensorFlow核心概念

TensorFlow™ 是一个采用数据流图（data flow graphs），用于数值计算的开源软件库。节点（Nodes）在图中表示数学操作，图中的线（edges）则表示在节点间相互联系的多维数据数组，即张量（tensor）。它灵活的架构让你可以在多种平台上展开计算，例如台式计算机中的一个或多个CPU（或GPU），服务器，移动设备等等。TensorFlow 最初由Google大脑小组（隶属于Google机器智能研究机构）的研究员和工程师们开发出来，用于机器学习和深度神经网络方面的研究，但这个系统的通用性使其也可广泛用于其他计算领域。

01

Sklearn、TensorFlow 与 Keras 机器学习实用指南第三版（九）

¹ Jasper Snoek 等人，“机器学习算法的实用贝叶斯优化”，《第 25 届国际神经信息处理系统会议论文集》2（2012）：2951–2959。

00

Tensorflow入门教程（七）——控制流操作：条件和循环

上一篇我介绍了Tensorflow中执行顺序和控制依赖关系。在构建循环神经网络等复杂模型时，可能需要通过条件和循环来控制操作流程。这一篇我会说一说一些常用的控制流程操作。

03

《机器学习实战：基于Scikit-Learn、Keras和TensorFlow》第12章使用TensorFlow自定义模型并训练

目前为止，我们只是使用了TensorFlow的高级API —— tf.keras，它的功能很强大：搭建了各种神经网络架构，包括回归、分类网络、Wide & Deep 网络、自归一化网络，使用了各种方法，包括批归一化、dropout和学习率调度。事实上，你在实际案例中95%碰到的情况只需要tf.keras就足够了（和tf.data，见第13章）。现在来深入学习TensorFlow的低级Python API。当你需要实现自定义损失函数、自定义标准、层、模型、初始化器、正则器、权重约束时，就需要低级API了。甚至有时需要全面控制训练过程，例如使用特殊变换或对约束梯度时。这一章就会讨论这些问题，还会学习如何使用TensorFlow的自动图生成特征提升自定义模型和训练算法。首先，先来快速学习下TensorFlow。

03

tensorflow学习笔记（三十五）：control flow

该文介绍了控制流、tf.case、tf.while_loop、tf.identity等TensorFlow函数的用法和示例，并给出了相应的代码示例。

基于tensorflow for循环 while循环案例

补充知识：tensorflow在tf.while_loop循环(非一般循环)中使用操纵变量该怎么做

01

[源码解析] TensorFlow 分布式之 ClusterCoordinator

本文我们主要来看看ParameterServerStrategy如何分发计算，也就是ClusterCoordinator如何运作。这是TF分布式的最后一篇。

03

一文教你在Colab上使用TPU训练模型

Google Colab免费为TPUs提供实验支持！在本文中，我们将讨论如何在Colab上使用TPU训练模型。具体来说，我们将通过在TPU上训练huggingface transformers库里的BERT来进行文本分类。

02

资源 | Tensorlang：基于TensorFlow的可微编程语言

选自GitHub 作者：Adam Bouhenguel 机器之心编译参与：路雪、黄小天、蒋思源近日，Adam Bouhenguel 在 GitHub 上发布了一种基于 TensorFlow 的新型编程语言 Tensorlang，适用于更快、更强大和更易用的大规模计算网络（如深度神经网络）。本文介绍了 Tensorlang 的优势。 GitHub 地址：https://github.com/tensorlang/tensorlang 我们的目标是为更快、更强大和更易用的大规模计算网络（如深度神经网络）定义

[翻译] 使用 TensorFlow 进行分布式训练

https://tensorflow.google.cn/guide/distributed_training（此文的信息是2.3版本之前）。

02

【tensorflow2.0】AutoGraph的使用规范

而Autograph机制可以将动态图转换成静态计算图，兼收执行效率和编码效率之利。

03

三种计算图

在TensorFlow1.0时代，采用的是静态计算图，需要先使用TensorFlow的各种算子创建计算图，然后再开启一个会话Session，显式执行计算图。

02

动态 | TensorFlow 2.0 新特性来啦，部分模型、库和 API 已经可以使用

由于令人难以置信的多样化社区，TensorFlow 已经发展成为世界上最受欢迎和广泛采用的 ML 平台之一。这个社区包括：

04

TensorFlow 2.0 - TFRecord存储数据集、@tf.function图执行模式、tf.TensorArray、tf.config分配GPU

注意：@tf.function修饰的函数内，尽量只用 tf 的内置函数，变量只用 tensor、numpy 数组

01

Autograph的使用规范

而Autograph机制可以将动态图转换成静态计算图，兼收执行效率和编码效率之利。

03

TensorFlow 2.0 Alpha 版发布啦！

【AI科技大本营导语】在今天举行的 2019 年 TensorFlow 开发者峰会上，谷歌宣布了其针对研究和生产的开源机器学习库的一些更新。TensorFlow 2.0 alpha 提供即将发生的变化的预览，旨在让初学者更容易使用 ML。

03

Tensorflow2.0常用基础API

tensorflow2.0改进之后已经非常像numpy形式了，不用像之前的session那样操作，一些基本的操作如下。需要注意的店以及部分数据均写在代码注释中。

文末福利｜一文上手TensorFlow2.0（一）

从现在开始我们就正式进入TensorFlow2.0的学习了，在这一系列文章里我们将重点介绍TensorFlow的基础知识和使用方法，为后面我们使用TensorFlow去解决一些实际的问题做好准备。2019年3月的TensorFlow开发者峰会上，TensorFlow2.0 Alpha版正式发布，2.0版相比之前的1.x（1.x泛指从1.0到1.13的各个TensorFlow版本）版做了很大的改进，在确保灵活性和性能的前提下易用性得到了很大的提升，对于初次接触TensorFlow的读者来说，建议直接从2.0版开始使用。

03

官方解读：TensorFlow 2.0中即将到来的所有新特性

作为最流行的深度学习框架，TensorFlow 已经成长为全球使用最广泛的机器学习平台。目前，TensorFlow 的开发者社区包括研究者、开发者和企业等。

03

[源码解析] TensorFlow 分布式之 ParameterServerStrategy V1

本章我们看看 ParameterServerStrategy，就是第一版代码。研究这个是因为目前工业界还有很多公司在使用，而且其内部机制也比较清晰易懂，值得我们分析。

01

官方解读：TensorFlow 2.0中即将到来的所有新特性

本文经机器之心（微信公众号：almosthuman2014）授权转载，禁止二次转载

02

tensorflow2.0的函数签名与图结构(推荐)

2．一个函数有了input_signature之后，在tensorflow里边才可以保存成savedmodel。在保存成savedmodel的过程中，需要使用get_concrete_function函数把一个tf.function标注的普通的python函数变成带有图定义的函数。

01

TensorFlow 高效编程

TensorFlow 和其他数字计算库（如 numpy）之间最明显的区别在于 TensorFlow 中操作的是符号。这是一个强大的功能，这保证了 TensorFlow 可以做很多其他库（例如 numpy）不能完成的事情（例如自动区分）。这可能也是它更复杂的原因。今天我们来一步步探秘 TensorFlow，并为更有效地使用 TensorFlow 提供了一些指导方针和最佳实践。

01

TensorFlow 2.X，会是它走下神坛的开始吗？

机器之心原创机器之心编辑部现在都 2021 年了，机器学习好填的坑都已经填了，大家都在想怎么将模型用到各种实际任务上。我们再去讨论深度学习框架，吐槽它们的体验，会不会有点过时？并不会，新模型与新算法，总是框架的第一生产力。从 Theano 一代元老，到 TensorFlow 与 PyTorch 的两元世界，到现在各个国产框架与工具组件的兴起。深度学习框架，总是跟随前沿 DL 技术的进步而改变。不过今天并不是讨论深度学习框架的演变，而只是单纯分享一下在算法工程中，使用 TensorFlow 遇到的各种

01

资源 | TensorFlow分布式计算机制解读：以数据并行为重

选自clindatsci 作者：Neil Tenenholtz 机器之心编译参与：Jane W、黄小天 Tensorflow 是一个为数值计算（最常见的是训练神经网络）设计的流行开源库。在这个框架中，计算流程通过数据流程图（data flow graph）设计，这为更改操作结构与安置提供了很大灵活性。TensorFlow 允许多个 worker 并行计算，这对必须通过处理的大量训练数据训练的神经网络是有益的。此外，如果模型足够大，这种并行化有时可能是必须的。在本文中，我们将探讨 TensorFlow 的

07

人工智能应用工程师技能提升系列1、——TensorFlow2

这里先说一下选择使用tensorflow2讲解的原因，在对比一下同类型的一个优势。由于我们这个系列的目标是学习，大家使用的都是win系统的电脑，故而这里选择tensorflow2方便得多。当前最新的版本是2.15

01

TensorFlow2.0 教程（2）

强烈安利 Google的Colab，即使你没有一台很好的电脑，也能在这个平台上学习TensorFlow

02

简单粗暴上手TensorFlow 2.0，北大学霸力作，必须人手一册！

这是一本简明的 TensorFlow 2.0 入门指导手册，基于 Keras 和 Eager Execution（即时运行）模式，力图让具备一定机器学习及 Python 基础的开发者们快速上手 TensorFlow 2.0。

04

TensorFlow 2.0 的新功能

2018 年 11 月，TensorFlow 迎来了它的 3 岁生日，我们回顾了几年来它增加的功能，进而对另一个重要里程碑 TensorFlow 2.0 感到兴奋！

01

谷歌千元级TPU芯片发布，TensorFlow更换Logo推出2.0最新版

今天凌晨，谷歌一年一度的TensorFlow开发者大会在加州举行。明明应该是一场软件盛会，却被生生开出了硬件发布会的味道。

02

谷歌工程师：TensorFlow已重获新生；网友：我还是用PyTorch

这次来自谷歌的工程师Cassie Kozyrkov。她发表博文称，TensorFlow升级到2.0版本后有了翻天覆地的变化，对新手更加友好了。

03

上线俩月，TensorFlow 2.0被吐槽太难用，网友：看看人家PyTorch

TensorFlow 被吐槽不好用，也不是一天两天了。TensorFlow 2.0 的发布似乎将这种「民怨」推上了高潮。

01

PyTorch还是TensorFlow？这有一份新手指南

问耕编译整理量子位出品 | 公众号 QbitAI 前几天，量子位发过一篇《忽悠VC指南》。其中有一条建议是，当你假装AI专家时，最好别谈众人皆知的TensorFlow，那谈什么？ PyTorch

03

[源码解析] TensorFlow 分布式之 MirroredStrategy 分发计算

前一篇我们分析了MirroredStrategy 的基本架构和如何更新变量，本文我们来看看 MirroredStrategy 如何运行。具体希望了解的是，MirroredStrategy 通过什么方式在远端设备节点上运行训练方法（如何分发计算），MirroredStrategy 和我们之前分析的 TF 运行时怎么联系起来？和 master，worker 这些概念怎么联系起来？

02

高阶API示范

TensorFlow有5个不同的层次结构：即硬件层，内核层，低阶API，中阶API，高阶API。本章我们将以线性回归为例，直观对比展示在低阶API，中阶API，高阶API这三个层级实现模型的特点。

02

中阶API示范

TensorFlow有5个不同的层次结构：即硬件层，内核层，低阶API，中阶API，高阶API。本章我们将以线性回归为例，直观对比展示在低阶API，中阶API，高阶API这三个层级实现模型的特点。

01

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭