专栏首页专知Tensorflow Eager Execution入门指南

Tensorflow Eager Execution入门指南

【导读】本文介绍了最新版的Tensorflow 1.7的功能及其使用方法,重点介绍其中最有趣的功能之一eager_execution,它许用户在不创建静态图的情况下运行tensorflow代码。本文给出了使用eager_execution的步骤及一些注意事项,并不涉及理论知识,如果您已经对Tensorflow有所了解,那么可以阅读以下本文,它能指导您使用这个有趣的功能。

作者 | Keshav Aggarwal

编译 | 专知

参与 | Yingying, Hujun

专知在以前就推出过TensorFlow 1.4 Eager Execution系列教程,欢迎查看。

关于Tensorflow Eager Execution的简要指南 – 走进数据科学

谷歌刚刚在Tensorflow Dev Summit 2018上推出了最新版本的Tensorflow,即Tensorflow 1.7。您可以在文章最后找到链接查看新版本所发生的改变。另外要观看完整Dev Summit(开发峰会),请访问这里相关链接(文末给出)。

以下是TF 1.7的主要亮点:

使用Eager Execution,你可以在没有session的情况下运行你的代码。

使用您自己的functions轻松解决梯度计算。

支持将数据库里的数据读成用于实验的数据集。

对TensorRT的初始支持,以便您可以优化您的模型。

最有趣的功能之一是eager_execution,允许用户在不创建图形的情况下运行tensorflow代码。 让我们尝试一个简单的程序:

注意输出是一个张量而不是实际的数组本身。为了得到数组值,你需要在session中运行它。正如您所知道的,创建大型神经网络时,您无法使用打印查看操作的输出,从而增加了调试的复杂性。要检查操作的输出,您需要运行session并检查session内的输出:

现在让我们换种方式再试一次:

现在通过使用tf.enable_eager_execution()可以获得实际值。在eager_execution中,操作的输出将是实际值而不是张量。

但tf.enable_eager_execution的使用并不那么简单。 看看下一个例子。 下面是一段变量声明:

所以声明一个Tensorflow变量会引发一个错误,应该使用tf.contrib.eager.Variable。 这意味着我们不能在已有程序中使用eager execution,并希望它能够工作。为了使用eager实现功能,您需要更改您的代码。

其中一个变化是,您可以使用tensorflow数据API来代替使用占位符和变量将数据提供给模型。 这通常更快,更易于管理。 以下是一个函数,它可根据平整化的图像,标签和批量大小(flattened images, labels and batch_size)来生成数据集。

现在让我们试试这个函数。 我们得到下面的结果。 我们可以使用迭代器访问数据集中的数据来进行批处理。

我们使用GradientTape记录所有操作以便稍后应用于梯度更新。

grad()函数返回关于权重和偏差的损失的导数。然后将此传递给optimizer.apply_gradients()完成梯度下降的过程。

除了上述变化外,几乎所有东西都保持不变。 在使用eager execution之前,以下是一些关键点:

1、 数据必须使用tensorcow.data.Dataset进行初始化。 (也可以使用其他方式,但不建议使用)

2、 eager execution默认在CPU上运行,要使用GPU,需要包含以下代码:with tf.device('/ gpu:0')

3、 eager execution不会创建张量图,要构建图只需要删除tf.enable_eager_execution()即可

4、 eager execution对开发(R&D)有好处,但在生产环境中你应该使用graph execution。

5、 您可以保存通过eager execution生成的模型,然后以graph 或eager execution的形式加载该模型。

以下是Google Colaboratory上的工作代码链接,您可以尝试使用该代码。、

https://drive.google.com/file/d/1EEiYUfE63S2IaADXwGT40nH5Ip2iri2-/view?usp=sharing

参考:

https://github.com/tensorflow/tensorflow/releases/tag/v1.7.0

https://www.youtube.com/watch?v=gplTc2F5Wvk

参考链接:

https://towardsdatascience.com/eager-execution-tensorflow-8042128ca7be

-END-

本文分享自微信公众号 - 专知(Quan_Zhuanzhi)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-04-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 【最新TensorFlow1.4.0教程02】利用Eager Execution 自定义操作和梯度 (可在 GPU 运行)

    点击上方“专知”关注获取更多AI知识! 【导读】主题链路知识是我们专知的核心功能之一,为用户提供AI领域系统性的知识学习服务,一站式学习人工智能的知识,包含人工...

    WZEARW
  • 【重磅】深度学习顶会ICLR2018评审结果出炉,一文快速了解评审分析简报和评分最高的十篇论文

    【导读】ICLR,全称为「International Conference on Learning Representations」(国际学习表征会议),201...

    WZEARW
  • 【干货】Batch Normalization: 如何更快地训练深度神经网络

    【导读】本文是谷歌机器学习工程师 Chris Rawles 撰写的一篇技术博文,探讨了如何在 TensorFlow 和 tf.keras 上利用 Batch N...

    WZEARW
  • 【转】JAVA之网络编程

    网络编程对于很多的初学者来说,都是很向往的一种编程技能,但是很多的初学者却因为很长一段时间无法进入网络编程的大门而放弃了对于该部分技术的学习。

    shirayner
  • JSShell:一个基于python的交互式Shell

    JSShell 本文将给大家介绍一款基于Web的多用户交互式Shell,该工具采用Python语言编写,服务器端使用的是Flask框架,而客户端当然就是Java...

    FB客服
  • 详解分布式系统本质:“分治”和“冗余”

    站在全局角度看,分布式系统的本质是什么?其实说白了,就是两点:“分治”和“冗余”。

    架构师修行之路
  • 《coredump问题原理探究》Linux x86版3.3节栈布局之局部变量

    版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/xuzhina/article/detai...

    血狼
  • 大神洗礼第四讲——函数相关及编程技巧

    Author:bakari       Date:2012.11.2 1、参数传递问题: < 1 >、堆栈传参 < 2 >、寄存器传参(利用通用寄存器进行函数参...

    CloudDeveloper
  • 火爆全网开源额温枪同平台之华大HC32L136 SDK开发入门

    到淘宝以及相关平台上不少商家为了蹭疫情额温枪的热度把额温枪开发方案的价格定得非常高,少则几千,多则上万,实在是让国人寒心!关键时刻,大家应该同心协力,即将没法向...

    morixinguan
  • kubeadm安装kubernetes V1.11.1 集群

    如果想要用二进制方法安装最新版本的Docker,可以参考我之前的文章在Redhat 7.3中采用离线方式安装Docker

    大江小浪

扫码关注云+社区

领取腾讯云代金券