我以官方文档为主线,开始对TensorFlow的学习。这期间会把我的理解进行持续的输出,作为《TensorFlow从0到1》系列。它不会止于翻译和笔记、语言和工具,而是坚持通过启发性的方式,循序渐进的构建理解,搭建一个坚实可靠的、连接“零基础”与“机器学习”领域之间的缓坡道,或许能帮你起步。
更期待一起探索的学习者都能开辟出自己的路,仅把这里作为一个参照。
除了TensorFlow文档之外,我还会参考(持续增加中):
关于机器学习如何重塑世界我就不啰嗦了,捡些实惠的与你分享。
根据麦肯锡全球研究院估计,截至2018年,仅美国就需要再培养14万~19万机器学习专家才够用,另外还需要150万有数据头脑的经理。
佩德罗·多明戈斯在《终极算法》一书中还说道:
一个懒惰又不那么聪明的计算机科学家,机器学习就是理想的职业,因为学习算法会完成所有事情,功劳却是你的。
Hello TensorFlow
在学习任何新的编程语言时,我们都会在第一时间完成Hello World,以宣告自己开发环境的完美搭建。TensorFlow也不例外。TensorFlow充分考虑了各种软/硬件平台上的安装,本篇记录了在我的笔电Win 10环境下的安装(在国内这应该是最常见的一种个人环境)并打印出“Hello TensorFlow !”的过程。
图1.TensorFlow
确认安装选项
在TensorFlow的官方文档中明确提到,即使你的机器中有NVIDIA GPU,也建议初学者先尝试CPU的版本。
对于第二个选项,安装Anaconda是个更好的选择。它是一个Python的发行版,包含Python和一个包管理器conda,而且囊括了常见的科学计算库,比起pip安装这些库要容易的多。此外利用conda可以直接创建和管理虚拟环境,比Native pip方式更加独立和灵活,这个在后面还会提到。
TF文档强调Anaconda是社区支持,而非官方支持,同时TF团队也不会测试和维护conda package。可以把它看成TensorFlow的免责声明,而非建议Native pip方式。
安装Anaconda
图2.Anaconda
我是从Anaconda官方下载的最新的“Anaconda3-4.3.1-Windows-x86_64.exe”(422M),下载了3个小时。事后才知道清华大学提供了Anaconda镜像,建议从此下载。
安装路径要求不能有空格,于是使用了默认安装路径:“C:\Users\Ethan”,一路Next安装完毕。安装过程会自动设置Anaconda环境变量。打开命令行,直接键入conda --version
,即可检查。为了conda能快速安装其他包,我立即设置了清华的镜像源。操作如下:
conda config --add channels http://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free conda config --set show_channel_urls yes
图3.设置镜像源
创建conda虚拟环境
为了安装TensorFlow,首先用conda创建一个conda虚拟环境。
conda不仅可以manage package,虚拟环境管理是其另一个非常强大的特性,在虚拟环境下可以隔离不同的package版本组合。我们创建一个干净的tensorflow环境,可以专用于研究和学习TF,而不需要为此动到Python的主环境(主环境可能还要支持其他的项目)。
通过以下命令创建一个名称为tensorflow的虚拟环境(虚拟环境的名字可以任意指定):
C:> conda create -n tensorflow python=3.5
TensorFlow安装文档中有明确提到:在Windows上TensorFlow仅支持的Python版本是3.5.x。可是前面我安装的Anaconda 4.3.1默认搭配的是Python 3.6。为了防止后续出现兼容性问题,我在上面的命令的末尾加了python=3.5
。这个参数表示当前创建的tensorflow虚拟环境搭配3.5.x的Python版本(此时是否看出了conda的威力),conda会自动的下载并安装3.5.x最新的版本。
创建虚拟环境的整个过程,如下图所示:
图4.创建虚拟环境
安装TensorFlow
TensorFlow是要安装到刚才创建的虚拟环境中去的。于是要先激活tensorflow环境:
C:> activate tensorflow (tensorflow)C:> # Your prompt should change
然后再安装TensorFlow的CPU版本。尽管conda也是包管理器,但是TensorFlow官方建议使用Python原生的包管理器来安装TensorFlow,使用pip install
命令,而不要用conda install
命令。此外,我这里还使用了清华的TensorFlow镜像url,也就是把官方的https://storage.googleapis.com/
替换为
https://mirrors.tuna.tsinghua.edu.cn/
即可。安装速度非常快,一两分钟即可装好。
(tensorflow)C:> pip install --ignore-installed --upgrade https://mirrors.tuna.tsinghua.edu.cn/tensorflow/windows/cpu/tensorflow-1.1.0-cp35-cp35m-win_amd64.whl
在安装Tensorflow时,像Numpy这些依赖会自动安装,见下图:
图5.安装TensorFlow
Hello, TensorFlow
终于要到Say Hello了。不要退出上节启动的虚拟环境,启动python,并直接键入后面的代码即可。
$ python >>> import tensorflow as tf >>> hello = tf.constant('Hello, TensorFlow!') >>> sess = tf.Session() >>> print(sess.run(hello))
代码中TensorFlow的各种函数调用,会在后面讲解。
实际运行如下图:
图6.Hello, TensorFlow!