【陆勤践行】小白一天之内玩转机器学习!

很多朋友都对机器学习心存各种敬畏之心。实际上,机器学习更多的也不过是我们“统计学习”的扩展延伸和行业实现的具体化。无非是通过样本数据发现规律性的东西而已。何况“All models are wrong”,没有必要将其神化。

大家可能在新闻中看到或听说了各种机器学习成果,像,语言翻译,人脸识别,图片识别等等,例如下图,手写数字的识别。他们的实现融合了各种工程技术,但对于我们小白来说,也并非遥不可及,高不可攀。

如何在一天之内玩转机器学习!

在这里,我们要使用另一种统计分析软件,Python(其实是一门程序语言,类似C,Java等)。其中有强大的机器学习软件包scikit-learn。

“玩转”攻略

1. 下载Anaconda套件,把python和195个库一键安装,记得,全选全安装,傻瓜式流程,不要节外生枝哦!

下载地址:http://continuum.io/downloads 选择适合自己电脑的版本(32位或者64位系统),其中记得选Python2.7版。

2.复制scikit-learn的notebook教程。

下载地址:https://github.com/jakevdp/sklearn_pycon2014 没有使用过GitHub的同学,可以找到下载zip的链接,下载整个文件包,将其中的notebooks文件夹解压出来,备用!

3. 运行ipython notebook(这是个程序,通过开始菜单或者快捷方式打开),打开上一步中notebooks文件夹中的.ipynb文件,然后就可以开始边看边学啦!

Tips:程序框中的代码,可以通过Ctrl+Enter运行哦~因为程序代码的相互依存性,想动手尝试的,需要从第一段代码开始,逐个Ctrl+Enter运行下来,才会出现结果哦!

上面提到的手写数字识别,以及随机森林、K-means聚类、Bias-Variance Tradeoff等昔日“酷炫”的概念就在指尖,要不要赶紧去尝试一下?!

随机森林:

K-means聚类:

Bias-Variance Tradeoff:

原文发布于微信公众号 - 数据科学与人工智能(DS_AI_shujuren)

原文发表时间:2015-06-19

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Spark学习技巧

Kylin及数据仓库的技术概念详解

一 cube 1, Table cube数据源的hive表的定义,在build cube之前需要进行同步。 2, Data Model 这描述了一个星型...

3208
来自专栏AI黑科技工具箱

0.伏笔:图像读取方式以及效率对比

入职了之后挺忙,已经好久没有做一些科普性的更新了。近期已做了些学术要求不高的工作,所以刚好有时间写写总结。

68111
来自专栏Web行业观察

我是如何爱上ag-grid框架的

与每个管理系统一样,我们需要选择一个网格来显示我们的数据,而我的前任已经在应用程序中使用了两个网格 -  ag-Grid(v2.7)和Ng-Table(v0.8...

1.1K4
来自专栏量子位

少年,这有套《街霸2》AI速成心法,想传授于你……

千平 发自 LZYY 量子位 出品 | 公众号 QbitAI ? “ 少年,我看你骨骼精奇,是万中无一的武学奇才。我这有套《街霸2》心法,见与你有缘,就十块钱卖...

4146
来自专栏大数据文摘

数学烂也要学AI | 带你造一个经济试用版AI终极必杀器

3729
来自专栏CDA数据分析师

入门 | 一小时向非程序员介绍 R 编程语言

来源 | 伯乐在线 我妹妹正在念大四,主修社会学。她刚刚签了下个学期一份不错的分析员工作,对方告诉她工作中要用到 R 编程语言。她让我在寒假时教教她,我欣然同意...

2606
来自专栏数说戏聊

Tableau构建销售监测体系(初级版)1.商业理解2.基本分析流程3.多数据源融合4.Top客户监测表制作

1242
来自专栏数据小魔方

一篇文章教你搞定JSON素材,从此告别SHP时代~

最近几天推送频率之所以下降了,不是因为偷懒,是在攻克一个难题~ 还记得前一篇推送,关于山东省财政数据可视化那一篇,因为没有精准、最新的山东省县级市边界地图素材数...

3666
来自专栏VRPinea

VR建模工具Blocks发布新版本,将更加易于使用

3739
来自专栏生信技能树

Bioconductor的质谱蛋白组学数据分析

4475

扫码关注云+社区

领取腾讯云代金券