专栏首页Java3y从零开始学TensorFlow【01-搭建环境、HelloWorld篇】

从零开始学TensorFlow【01-搭建环境、HelloWorld篇】

前言

只有光头才能变强。 文本已收录至我的GitHub仓库,欢迎Star:https://github.com/ZhongFuCheng3y/3y

TensorFlow logo

最近在学习TensorFlow的相关知识,了解了TensorFlow一些基础的知识,现在周末有空了,就写写一些笔记,记录一下自己的成长~

总的来说,TensorFlow还是一个比较新的技术,有兴趣的同学不妨跟着我的笔记,一起学学呗(反正没坏处)~

前面回顾:

知识背景:没有Python基础,没有机器学习基础,可以说是真正从零学TensorFlow的了。

一、安装Tensorflow所需要的环境

1.1安装Python环境

使用环境:Mac

Python有好多个版本,在Mac中自带的Python版本是2.7,但相对而言比较老了。现在一般用Python3.x了,本次下载的版本是3.5.6

我安装Python所使用方法的大致步骤:

  • 安装Homebrew
  • 安装pyenv
  • .bash_profile添加环境变量
  • 让环境变量生效
  • 安装3.X版本python

详情可参考如下的链接(总的来说,我根据下面的教程一下子就安装了我想要的Python版本,还是非常不错的。):

  • Mac下安装多版本python:
    • https://www.cnblogs.com/webgiser/p/7463974.html
  • pyenv相关的命令(常用的pyenv命令):
    • https://www.jianshu.com/p/af1f8d7b6b31

在安装Python的时候也发现了一个小知识点:

  • Mac一般使用bash作为默认的shell,会有好几个环境变量,其中etc/profile系统级的,还有几个用户级别的环境变量,比如说:~/.bash_profile
  • 如果修改的是系统级别的环境变量,也就是etc/profile,在保存的时候只能是:wq!覆盖,不然会出现readonly错误

(至于TensorFlow和numpy依赖的下载,这里我就不说了,就两条命令就搞掂啦)

1.2PyCharm编辑器

Java有IDEA神器,同样的,Python也有PyCharm,同样是JetBrains出产的。

我在之前从来没使用过PyCharm,也没写过一句的Python代码。

把Pycharm安装好了之后,我想当然就new project去用了,然后就next,next,next,当成IDEA来用。但发现了一个问题:我在之前明明装好了TensorFlow和numpy的依赖,在PyCharm环境下却识别不出来!在命令行窗口下,依赖是存在的!

后来才发现:如果用PyCharm去new一个project,会默认建一个解析器在当前的项目目录下。而PyCharm会遵守“就近原则”使用当前项目路径下的解析器。而我们添加的依赖(TensorFlow、numpy)是在我们安装Python的路径下的,这就导致了在命令行下找到依赖,而在PyCharm中找不到依赖。

解决也很简单:在PyCharm指定一下我们安装Python的路径,切换一下就好了。

参考资料:

  • 关于pip安装第三方库,但pycharm中却无法识别的问题;以及pycharm安装第三方库的方法解析
    • https://blog.csdn.net/weixin_41287260/article/details/83957731

二、体验TensorFlow

好的,我们现在已经安装好TensorFlow所需要的环境了!(看起来好简单,但还是花了我不少时间….)

官网的Demo链接(需要科学上网):

  • https://www.tensorflow.org/tutorials/keras/basic_classification

首先我们来看一下这个例子可以干些什么:我们有非常多张的图片(数据集),这些图片有不同的类型(比如衣服、鞋子、裤子,一共有10种类型),把这些数据集扔进我们的神经网络里头,生成出模型。有了模型以后,当我们再将类似的图片扔进去,这个模型可以帮我们预测这张图片是衣服还是鞋子还是裤子。

数据集

随后,我跟着官网的代码跑了一(代码我都只是一步一步复制粘贴),最后跑起来:

# TensorFlow and tf.keras
import tensorflow as tf
from tensorflow import keras

# Helper libraries
import numpy as np

print(tf.__version__)

# 加载数据、区分出测试数据和训练数据
# 注意:如果已经下过,重复下载的话,可能会出现EOFError: Compressed file ended before the end-of-stream marker was reached错误

fashion_mnist = keras.datasets.fashion_mnist
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

# 分类的列表
class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat',
               'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

# 查看数据的值
print(train_images.shape)  # 样本的shape(可以看出有多少条样本、维度)
print(len(train_labels))  # label的个数,有多少个样本,就应该有多少个label
print(train_labels)  # label的值,对应上面分类列表(从0到9)


# 对测试数据和训练数据进行预处理(实际上就是归一化)
train_images = train_images / 255.0
test_images = test_images / 255.0

# 设置层  (初始处理)--- 建立神经层
model = keras.Sequential([
    keras.layers.Flatten(input_shape=(28, 28)),
    keras.layers.Dense(128, activation=tf.nn.relu),
    keras.layers.Dense(10, activation=tf.nn.softmax)
])


# 损失函数、优化器、指标
model.compile(optimizer=tf.train.AdamOptimizer(),
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

# 将训练集丢进去,训练出模型(Model)
model.fit(train_images, train_labels, epochs=5)

# 将测试数据丢到模型中,评估一下得分(准确率)
test_loss, test_acc = model.evaluate(test_images, test_labels)
print('Test accuracy:', test_acc)

# 评估完准确率以后,我们可以对测试数据进行预测
predictions = model.predict(test_images)

# 选第一个样本预测后的得出最有可能结果
print(np.argmax(predictions[0]))

# 对比结果
print(test_labels[0])

跑出来的结果:

(后期注释:这是TensorFlow的版本)

1.12.0

(后期注释:这是TensorFlow下载数据集的日志)

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
32768/29515 [=================================] - 0s 3us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz

26427392/26421880 [==============================] - 12s 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
8192/5148 [===============================================] - 0s 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz

4423680/4422102 [==============================] - 2s 0us/step

(后期注释:样本的shape)

(60000, 28, 28)

(后期注释:样本有多少条,对应的label就有多少条)

60000

(后期注释:label的值是从0-9,表示有九种类别)

[9 0 0 ... 3 0 5]

(后期注释:开始训练)

Epoch 1/5
2019-02-19 14:00:46.842852: I tensorflow/core/platform/cpu_feature_guard.cc:141] Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2 FMA

60000/60000 [==============================] - 4s 65us/step - loss: 0.4995 - acc: 0.8246
Epoch 2/5
60000/60000 [==============================] - 4s 62us/step - loss: 0.3734 - acc: 0.8655
Epoch 3/5
60000/60000 [==============================] - 4s 63us/step - loss: 0.3346 - acc: 0.8788
Epoch 4/5
60000/60000 [==============================] - 4s 63us/step - loss: 0.3102 - acc: 0.8861
Epoch 5/5
60000/60000 [==============================] - 4s 63us/step - loss: 0.2918 - acc: 0.8916

10000/10000 [==============================] - 0s 36us/step

(后期注释:预测出来的精确度)

Test accuracy: 0.8514

(后期注释:选第一个样本进行预测,并对比实际的结果)

9
9

参考资料:

  • TensorFlow官网的例子(需要科学上网才能进..)
  • Tensorflow学习笔记之一:训练你的第一个神经网络——基础分类
    • https://www.jianshu.com/p/d4fb3a391d22

2.1总结一下使用TensorFlow的步骤

  1. 加载数据:使用dataset的api加载数据,并将数据集分成训练数据和测试数据
  2. 检查数据:检查dataSet的数据有没有问题(例如,样本的记录数、label的记录数等)
  3. 对数据预处理:对测试数据和训练数据进行归一化处理,目的:减少因为数值的大小所带来的影响(一般我们会将值都缩小在一个小的范围内)
  4. 建立神经网络:(输入层、隐藏层、输出层)
  5. 为模型定义损失函数、优化器、指标
  6. 将训练数据丢进我们的神经网络中,生成出Model
  7. 将测试数据丢进我们生成好的Model进行评估,预测出我们的准确率

三、TensorFlow介绍

3.1什么是TensorFlow

如果去Google搜关键字“TensorFlow”,那可能你会看到这么一句话:

An open source machine learning framework for everyone.

没错,TensorFlow就是一个机器学习的框架。至于框架,相信大家也比较好理解了;类比到Java,比如说我们的Spring框架给我们封装了好多好用的API,简化我们的开发(想想当年写Servlet的时候!)

TensorFlow作为机器学习的框架,同样也给我们封装了好多好用的API,能够降低学习机器学习的门槛

  • 就拿上面的例子来说,没想到那么少的代码就可以跑机器学习的“HelloWorld”了!

至于机器学习和神经网络的相关基础,我强烈建议读读这两篇文章!通俗易懂的科普文章:

3.2TensorFlow的架构

我们可以发现上面的Demo所用的基础语言是Python,但不要认为TensorFlow就是Python的一个框架。我看到过一个比喻,觉得写得挺好的,粘贴一下:

Python 和 Tensorflow 之间的联系,可以类比 Javascript 和 HTML 之间的关系。Javascript 是一种全功能的编程语言,可以实现各种出色的效果。HTML 是用于表示某种类型的实用计算抽象(这里指的是可由 Web 浏览器呈现的内容)的框架。Javascript 在交互式网页中的作用是组装浏览器看到的 HTML 对象,然后在需要时通过将其更新为新的 HTML 来与其交互。

  • 作者:AI前线
  • 链接:https://juejin.im/post/5b345a49f265da599c561b25

下面再来看看TensorFlow的架构图(Python只是对TensorFlow进行了封装)

Python封装了TensorFlow引擎

TensorFlow的引擎也是分了很多模块的(这里我们简单了解一下):

TensorFlow架构

最后

总结一下这篇文章:

  • 安装TensorFlow必要的环境
  • 跟着官方文档,体验一下TensorFlow(机器学习)的“HelloWorld”
    • 根据给出的例子,猜出使用TensorFlow(机器学习)时需要做哪些步骤
  • TensorFlow就是一个机器学习(深度学习)的框架,提供了很多实用的API方便我们去玩机器学习(深度学习)。

相信看到这里,很多人都跟我之前一样,一脸懵逼。对官方给出的例子中的API不熟悉,去查阅相关资料的时候又发现有好多机器学习相关的术语,对这些术语又不了解。然后就循环懵逼..

while(true){
    // 循环懵逼..
}

其实回想刚学Java的时候,也是这么一个过程,当你从屏幕看到“HelloWorld”了以后,大概率来说也是不了解相关的API具体做了什么事(甚至连API都不知道是啥意思)。但花一段时间去学习了以后,就会发现,原来HelloWorld是真的简单!

public static void main(String[] args) {

    System.out.println("Hello World");

}

后续我会继续更新我学习TensorFlow时的一些笔记,有兴趣的小伙伴不妨跟着我一起学习~

另外,从文章的开头我也已经说了,我对Python、机器学习都是没有相关基础的,如果有写错的地方不妨在评论区留言指正。

下一篇预告:TensorFlow是什么意思?Tensor?Flow?介绍TensorFlow一些最基础的知识以及常见的机器学习术语。

乐于输出干货的Java技术公众号:Java3y。公众号内有200多篇原创技术文章、海量视频资源、精美脑图,不妨来关注一下!

本文分享自微信公众号 - Java3y(java3y)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-03-02

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 使用AI和TPU,人类首次重建果蝇大脑所有神经元,论文登上《细胞》杂志

    论文:https://www.biorxiv.org/content/biorxiv/early/2019/04/11/605634.full.pdf

    机器之心
  • MLK | Keras 入门深度学习逢看必会

    Keras作为深度学习工具,对于 初学者还是蛮友好的,在安装前,我们要知道Keras 是一个用 Python 编写的高级神经网络 API,它能够以 Tensor...

    Sam Gor
  • TPU、GPU、CPU深度学习平台哪家强?有人做了一个基准测试研究

    作者:Yu (Emma) Wang、Gu-Yeon Wei、David Brooks

    机器之心
  • 入门机器学习,照这个课程清单按顺序学就对了

    Chip Huyen 是一位来自越南的作家和计算机科学家,现居于美国硅谷,就职于英伟达人工智能应用团队。

    机器之心
  • 神经阅读理解与超越:基础篇

    原文链接:https://chendq-thesis-zh.readthedocs.io/en/latest/

    Sam Gor
  • 【论文】 NLP中命名实体识别从机器学习到深度学习的代表性研究

    NER是自然语言处理中相对比较基础的任务,但却是非常重要的任务。在NLP中,大部分的任务都需要NER的能力,例如,聊天机器人中,需要NER来提取实体完成对用户输...

    zenRRan
  • KDD 提前看 | KDD 里的技术实践和突破

    数据挖掘、深度学习以及其他机器学习的模型、算法在过去几年一直保持快速发展,研究人员不断提出了大量优秀的模型、算法等,在实验条件下,模型和算法的准确度、处理速度等...

    机器之心
  • 深度学习的一些经验总结和建议| To do v.s Not To Do

    昨天看到几篇不同的文章写关于机器学习的to do & not to do,有些观点赞同,有些不赞同,是现在算法岗位这么热门,已经不像几年前一样,可能跑过一些项目...

    石晓文
  • MLK | Keras 基础模型调参指南

    上一篇文章讲解了如何简易入门Keras,大致给出了一个深度学习模型,但对于模型如何调参就没有太过于深入讲解,今天继续写一篇文章来整理下 Keras 深度学习模型...

    Sam Gor
  • 做目标检测,这一篇就够了!2019最全目标检测指南

    计算机视觉是一门研究如何对数字图像或视频进行高层语义理解的交叉学科,它赋予机器“看”的智能,需要实现人的大脑中(主要是视觉皮层区)的视觉能力。

    统计学家

扫码关注云+社区

领取腾讯云代金券