小白一天之内玩转机器学习!

很多朋友都对机器学习心存各种敬畏之心。实际上,机器学习更多的也不过是我们“统计学习”的扩展延伸和行业实现的具体化。无非是通过样本数据发现规律性的东西而已。何况“All models are wrong”,没有必要将其神化。

大家可能在新闻中看到或听说了各种机器学习成果,像,语言翻译,人脸识别,图片识别等等,例如下图,手写数字的识别。他们的实现融合了各种工程技术,但对于我们小白来说,也并非遥不可及,高不可攀。

如何在一天之内玩转机器学习!

在这里,我们要使用另一种统计分析软件,Python(其实是一门程序语言,类似C,Java等)。其中有强大的机器学习软件包scikit-learn。

“玩转”攻略

1. 下载Anaconda套件,把python和195个库一键安装,记得,全选全安装,傻瓜式流程,不要节外生枝哦!

下载地址:http://continuum.io/downloads 选择适合自己电脑的版本(32位或者64位系统),其中记得选Python2.7版。

2.复制scikit-learn的notebook教程。

下载地址:https://github.com/jakevdp/sklearn_pycon2014 没有使用过GitHub的同学,可以找到下载zip的链接,下载整个文件包,将其中的notebooks文件夹解压出来,备用!

3. 运行ipython notebook(这是个程序,通过开始菜单或者快捷方式打开),打开上一步中notebooks文件夹中的.ipynb文件,然后就可以开始边看边学啦!

Tips:程序框中的代码,可以通过Ctrl+Enter运行哦~因为程序代码的相互依存性,想动手尝试的,需要从第一段代码开始,逐个Ctrl+Enter运行下来,才会出现结果哦!

上面提到的手写数字识别,以及随机森林、K-means聚类、Bias-Variance Tradeoff等昔日“酷炫”的概念就在指尖,要不要赶紧去尝试一下?!

随机森林:

K-means聚类:

Bias-Variance Tradeoff:

以上三步,真的一天之内就可以搞定哦!赶紧动手吧!

原文发布于微信公众号 - 大数据挖掘DT数据分析(datadw)

原文发表时间:2015-05-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Data Analysis & Viz

手把手教你完成一个数据科学小项目(3):数据异常与清洗

本系列将全面涉及本项目从爬虫、数据提取与准备、数据异常发现与清洗、分析与可视化等细节,并将代码统一开源在GitHub:DesertsX/gulius-proje...

1083
来自专栏腾讯移动品质中心TMQ的专栏

用户画像准确性评测初探 ——拨开python大数据分析的神秘面纱

第一部分会对零零散散进行了两个多月的用户画像评测做个简要回顾和总结,第二部分会对测试中用到的python大数据处理神器pandas做个整体介绍。

4684
来自专栏吉浦迅科技

DAY80:阅读Compute Capability 3.x

When a multiprocessor is given warps to execute, it first distributes them among...

1404
来自专栏IT派

争论|摩尔定律已死?GPU会取代CPU的位置吗?

如果你觉得好的话,不妨分享到朋友圈。 京举办的NVIDIA GTC China会议中,无论是AI智能运算,还是服务器数据中心、智能城市,甚至还有去年很火热但是...

3514
来自专栏大数据挖掘DT机器学习

【实战帖】使用Python分析社交网络数据

目录 数据抓取 一、直接抓取数据 二、模拟浏览器抓取数据 三、基于API接口抓取数据 数据预处理 可视化 数据分析 扩散深度 扩散速度 空间分布 节点属性 网...

6259
来自专栏程序员互动联盟

小菜学Chromium开发系列:OpenGL学习

风雨送春归,飞雪迎春到。已是悬崖百丈冰,犹有花枝俏。俏也不争春, 只把春来报。待到山花烂漫时,她在丛中笑。 这首《毛泽东诗词》·卜算子·咏...

2685
来自专栏SeanCheney的专栏

《利用Python进行数据分析·第2版》第1章 准备工作1.1 本书的内容1.2 为什么要使用Python进行数据分析1.3 重要的Python库matplotlibIPython和JupyterSc

下载本书:http://www.jianshu.com/p/fad9e41c1a42(更新为GitHub链接) 下载本书代码:https://github.c...

3937
来自专栏数据魔术师

干货|十分钟快速掌握CPLEX求解VRPTW数学模型(附JAVA代码及CPLEX安装流程)

号外!号外!常年用 TSP 举例的某干货分享板块终于 倒闭 改革了!小编终于被boss揪去关·禁·闭、学·习·进·阶、突·破·自·我了! 本着 独学学 ...

2.4K9
来自专栏hotqin888的专栏

浅谈onlyoffice文档协作在工程设计中的应用——共享excel计算书

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/hotqin888/article/det...

1272
来自专栏数据派THU

独家 | 提速20倍!3个细节优化Tableau工作簿加载过程(附实例)

Katarzyna "Kasia" Gasiewska的Tableau Public主页上经常有一些精彩的可视化作品,她拥有100多位粉丝,如果你没有位列其中,...

872

扫码关注云+社区