小白一天之内玩转机器学习!

很多朋友都对机器学习心存各种敬畏之心。实际上,机器学习更多的也不过是我们“统计学习”的扩展延伸和行业实现的具体化。无非是通过样本数据发现规律性的东西而已。何况“All models are wrong”,没有必要将其神化。

大家可能在新闻中看到或听说了各种机器学习成果,像,语言翻译,人脸识别,图片识别等等,例如下图,手写数字的识别。他们的实现融合了各种工程技术,但对于我们小白来说,也并非遥不可及,高不可攀。

如何在一天之内玩转机器学习!

在这里,我们要使用另一种统计分析软件,Python(其实是一门程序语言,类似C,Java等)。其中有强大的机器学习软件包scikit-learn。

“玩转”攻略

1. 下载Anaconda套件,把python和195个库一键安装,记得,全选全安装,傻瓜式流程,不要节外生枝哦!

下载地址:http://continuum.io/downloads 选择适合自己电脑的版本(32位或者64位系统),其中记得选Python2.7版。

2.复制scikit-learn的notebook教程。

下载地址:https://github.com/jakevdp/sklearn_pycon2014 没有使用过GitHub的同学,可以找到下载zip的链接,下载整个文件包,将其中的notebooks文件夹解压出来,备用!

3. 运行ipython notebook(这是个程序,通过开始菜单或者快捷方式打开),打开上一步中notebooks文件夹中的.ipynb文件,然后就可以开始边看边学啦!

Tips:程序框中的代码,可以通过Ctrl+Enter运行哦~因为程序代码的相互依存性,想动手尝试的,需要从第一段代码开始,逐个Ctrl+Enter运行下来,才会出现结果哦!

上面提到的手写数字识别,以及随机森林、K-means聚类、Bias-Variance Tradeoff等昔日“酷炫”的概念就在指尖,要不要赶紧去尝试一下?!

随机森林:

K-means聚类:

Bias-Variance Tradeoff:

以上三步,真的一天之内就可以搞定哦!赶紧动手吧!

原文发布于微信公众号 - 大数据挖掘DT数据分析(datadw)

原文发表时间:2015-05-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏何俊林

优化工作的冰山一角,app瘦身

前言:爱奇艺的产品有很多,业务线都有不同,我们业务部的主要产品是银河~奇异果,属于在智能电视上的app。对于我们播放组主要是做各产品的播放支撑及对接,还包括一些...

1738
来自专栏Android 开发者

Android Sunflower 带您玩转 Jetpack

△ 插图作者:Virginia Poltrack 在 Google I/O 2018 开发者大会上,我们推出了 Android Jetpack,其中包含的 An...

1041
来自专栏一心无二用,本人只专注于基础图像算法的实现与优化。

Crimm Imageshop 2.3。

下载地址:http://files.cnblogs.com/Imageshop/ImageShop.rar     一款体积小,能绿色执行,又功能丰富的图像处...

1948
来自专栏JAVA技术站

灰度环境发布策略 转

灰度发布是指在黑与白之间,能够平滑过渡的一种发布方式。AB test就是一种灰度发布方式,让一部分用户继续用A,一部分用户开始用B,如果用户对B没有什么反对意见...

393
来自专栏数据派THU

独家 | Python数据分析入门指南

作者:Zack Jost 翻译:梁傅淇 校对:丁楠雅 本文长度为1500字,建议阅读3分钟 Zack Jost是美国第一资本投资国际集团的首席数据科学家,这是他...

1836
来自专栏大数据文摘

手把手 | 关于商业部署机器学习,这有一篇详尽指南

有关深度学习或机器学习方面的文章层出不穷,涵盖了数据收集,数据整理,网络/算法选择,训练,验证和评估等主题。

1030
来自专栏Python小屋

Python批量生成垃圾邮件内容

问题背景:这个文章的代码是为下一篇关于贝叶斯分类的文章做准备的,用来生成一些模拟的垃圾邮件。一般而言,垃圾邮件都是带有特定目的的,所以邮件中必然会包含一些特定的...

3306
来自专栏算法+

pytorch 移动端框架 thnets 附c示例代码

前年年前做一个手机移动端图像识别项目的时候, 先后尝试了mxnet,thnets,caffe,tensorflow. 当时的情况是,mxnet内存管理奇差,内存...

3957
来自专栏机器之心

资源 | 机器学习新框架Propel:使用JavaScript做可微分编程

2697
来自专栏AILearning

TensorFlow架构

我们设计了TensorFlow进行大规模的分布式训练和推理,但它也足够灵活,以支持新机器学习模型和系统级优化的实验。 本文档描述了使得这种组合规模和灵活性成...

3377

扫描关注云+社区