深度学习:用tensorflow建立线性回归模型

1. TensorFlow 是什么

是一个深度学习库,由 Google 开源,可以对定义在 Tensor(张量)上的函数自动求导。

Tensor(张量)意味着 N 维数组,Flow(流)意味着基于数据流图的计算,TensorFlow即为张量从图的一端流动到另一端。

它的一大亮点是支持异构设备分布式计算,它能够在各个平台上自动运行模型,从电话、单个CPU / GPU到成百上千GPU卡组成的分布式系统。

支持CNN、RNN和LSTM算法,是目前在 Image,NLP 最流行的深度神经网络模型。

一周之前我连tensorflow、scikit-learn是什么都不清楚,也不知道数据挖掘分为传统机器学习(scikit-learn)跟深度学习(tensorflow),但是不重要嘛,伟大的毛主席教导我们“战略上藐视敌人,战术上重视敌人”,不就是工具么,不会造轮子了,本姑娘还不会用轮子么?

不知道会不会有人质疑,人家问tensorflow,你说什么scikit-learn,我回答就是找感觉,毕竟机器学习比深度学习看起来更接地气一些。我先在我的电脑上安装了,numpy、scipy、matplotlib这几个基础的python库,然后numpy的基础用法自己敲了一遍。为啥,因为我首先要知道矩阵也就是所谓的特征,是个什么样子,最基础的东西吧。顺便复习一下高等数据矩阵部分。了解一下scipy里面的前三个问题‘最小二乘拟合、函数最小值、非线形方程组求解’,这个部分会涉及到求导、函数微分的知识。其实我觉得倒数第二部分‘滤波器设计’应该也看一下,因为是神经网络很重要的一部分。matplotlib就是图形化显示,我觉得会用就行。

我是有条主线,然后不会的就在网上查,博客啊什么的,有的一个知识点不同人有很多不同的解释,看不懂那个解释,就再找另一个解释,有时候突然就能想通。我之前看过一篇解释傅立叶变换的文章,其实说到已经很清楚了,但当时就是转不过视角来,后来有一天看神经网络的文章,就是解释关于过滤不重要信息的一个问题,突然两个解释一结合,两个问题都想通了。

我大概学了‘协同过滤、主成分分析、k-means、svm、决策树、线性回归、逻辑回归’这几种算法。

真正项目应该是几种算法的协同作战,比如先用主成分分析找出重要的特征,在进行下一步的线性拟合等。

我对这几种算法的的程度就是能写出数学公式,以及为什么要用这个数学公式,比如协同过滤求相似系数有很多中方法,欧几里得、皮尔逊相似,欧几里得不说了,两点间的距离。皮尔逊相似跟欧几里得比的好处是什么,以及皮尔逊相似是协方差跟标准差的比,这里又要复习一下期望、方差、标准差、均值等数学知识。其他类似。

每学到一个算法都去网上找相应的小例子实现,辅助理解,加深记忆,更重要的是增强自信。而且这样调用框架的时候就不觉得跟变魔术似的了。打个比方,自己实现决策树的信息增益比(c4.5)比较麻烦,但是实现一个协同过滤的欧几里得很简单吧,但是这样心里就会有数,不管看起来多复杂的算法,就是这样由一些简单的数学公式堆砌的。

然后我就安装了scikit-learn,有个推荐电影的例子,数据集、代码都是现成的、每个函数都要理解、不会就查,运行出结果我觉得这就算入门啦。

tensorflow好像主要是做用来做神经网路的吧,我就是用cnn实现了一个验证码识别,网上有实例。对cnn的理解,网上文章特别多,多看看总能找到一个自己能理解的角度。还有几种常见的损失函数。为什么选sigmoid函数,而不选softmax函数,我看过一篇非常好的文章,找不到链接了。

当然还有些细节没提到,但是,我觉得这就算“入门”啦! 至于什么清洗、特征选取、调优……来日方长嘛~!

以下是用tensorflow建立线性回归模型,会python语言都看得懂,很简单!

本文分享自微信公众号 - 大数据挖掘DT数据分析(datadw)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-07-03

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏ATYUN订阅号

建立智能的解决方案:将TensorFlow用于声音分类

对于人类的语音识别,目前有很多不同的项目和服务,像Pocketsphinx,谷歌的语音API,以及其他等等。这样的应用程序和服务能够以一种很不错的质量识别语音然...

62670
来自专栏ATYUN订阅号

防止在训练模型时信息丢失 用于TensorFlow、Keras和PyTorch的检查点教程

如果你玩过电子游戏,你就会明白为什么检查点(chekpoint)是有用的了。举个例子,有时候你会在一个大Boss的城堡前把你的游戏的当前进度保存起来——以防进入...

72050
来自专栏ATYUN订阅号

【实践】伪造名人的脸—做一个小示例了解生成式对抗网络

生成式对抗网络(GAN)的概念由Ian Goodfellow提出。Goodfellow使用了艺术评论家和艺术家的比喻来描述这两个模型比喻发生器和鉴别,它们组成了...

42640
来自专栏ATYUN订阅号

【干货】圣诞老人是否真实存在?训练Tensorflow的对象检测API能够告诉你答案

背景:最近我们看到了一篇文章,关于如何用于你自己的数据集,训练Tensorflow的对象检测API。这篇文章让我们对对象检测产生了关注,正巧圣诞节来临,我们打算...

38480
来自专栏ATYUN订阅号

【行业】注意!腾讯在Google的AI平台TensorFlow中发现了主要的漏洞

Google被认为是推动全球AI革命的领导者,但它给开发人员提供的工具可能并不像许多人想象的那么安全。中国社交游戏巨头腾讯的一个安全团队最近声称,它在Googl...

31230
来自专栏ATYUN订阅号

不怕学不会 使用TensorFlow从零开始构建卷积神经网络

人们可以使用TensorFlow的所有高级工具如tf.contrib.learn和Keras,能够用少量代码轻易的建立一个卷积神经网络。但是通常在这种高级应用中...

42960
来自专栏ATYUN订阅号

C-SATS工程副总裁教你如何用TensorFlow分类图像 part2

我们都知道,适当的训练对于将来有效的分类来说至关重要,为了训练工作,我们需要大量准确标记的数据。在第一部分中,我通过下载3000个预先标记的图像跳过了这个挑战。...

38180
来自专栏ATYUN订阅号

【教程】OpenCV—Node.js教程系列:用Tensorflow和Caffe“做游戏”

? 今天我们来看看OpenCV的深度神经网络模块。如果你想要释放神经网络的awesomeness来识别和分类图像中的物体,但完全不知道深度学习如何工作,也不知...

56780
来自专栏钱塘大数据

【干货】数据科学和机器学习的工具使用情况分布

第18届年度KDnuggets软件投票又一次受到了分析、数据科学界和软件生产商的热情参与。与去年相似,约有2900人参与了此次投票。 最近几年,Python的使...

36370
来自专栏ATYUN订阅号

【教程】利用Tensorflow目标检测API确定图像中目标的位置

深度学习提供了另一种解决“Wally在哪儿”(美国漫画)问题的方法。与传统的图像处理计算机视觉方法不同的是,它只使用了少量的标记出Wally位置的示例。 在我的...

79660

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励