“表”解机器学习

导语:在过去的几个月里,作者一直在专注于整理归纳AI的各类小要点。在被越来越多的朋友同事问及时,我决定将这些总结和心得的完整版分享给大家。为了增加内容的趣味性和可读性,我也在每个主题下面加了些注解,希望对你们有用。

另外,小编在这里邀请大家加入到我们,小编Tom邀请你一起搞事情!

神经网络

各种公式~

机器学习

概 览

Scikit-learn 算法

这张图可以帮助你找到正确的估计器,这应该是机器学习汇总最难的部分。下面的流程图可以帮助快速查找文档,并对每种估计器做了大致的介绍,有助你更快了解问题并找到解决方案。

Scikit-learn(学名scikits.learn)是一个免费的机器学习Python编程语言库。包括了各类分类、回归与聚类算法,并支持向量机、随机森林、梯度提升、 K-means和DBSCAN。它还可以与Python NumPy和SciPy进行交互。

Microsoft Azure 算法

这个微软Azure的机器学习表可以帮助你为预测分析方案选择合适的机器学习算法。首先根据数据的性质,匹配最佳算法。

用于数据科学的Python

TensorFlow

今年5月,Google宣布在第二代TPU和Google计算引擎中加入对TPU的支持。第二代TPU拥有高达180 teraflops的性能。当 64个TPU组合在一起时,可以提供高达11.5千万亿次的浮点运算性能。

Keras

今年,Google也在TensorFlow的核心库中支持Keras。Chollet认为比起端到端的机器学习框架,Keras更应作为一个接口。它提供的是更高级别、更直观的抽象集,使得无论后端科学计算库是什么,都可以轻松地配置神经网络。

Numpy

NumPy 是针对Python中的一个非优化的字节码解释器——CPython的参考实现。针对这一版本的Python编写数学算法的运行速度相对较慢的问题,Numpy 使用的是多维数组和函数与运算符来改写部分代码,从而提高运行的效率。

Pandas

“Pandas”的名字源于“Panel Data”,是多维结构化数据集的计量经济学术语。

数据预处理

数据预处理(data wrangler)一词已经开始渗透进了流行文化中。今年的电影“金刚·”中,演员Marc Evan Jackson饰演的角色Steve Woodward正是被介绍为——我们的数据处理者。

用 Dplyr 与 Tidyr 进行数据预处理

SciPy

SciPy 是基于NumPy数组对象构建的,是NumPy堆栈的一部分,包括 Matplotlib,pandas和SymPy 等工具,以及扩展的科学计算库集。该NumPy 堆栈与其他应用程序(比如MATLAB,GNU Octave 和 Scilab)用户差不多。NumPy堆栈有时也被称为SciPy堆栈。

Matplotlib

Matplotlib是Python编程语言及其数学数学扩展NumPy的绘图库,提供了面向对象的API,用于使用 Tkinter、wxPython、Qt或GTK +等通用GUI工具包将图形嵌入到应用程序中。还有一个基于状态机(如OpenGL)的程序 “pylab”接口,很像MATLAB,但不鼓励使用。

Pyplot 是matplotlib的一个模块,提供了一个类似MATLAB的界面。Pyplot 跟MATLAB一样容易上手,兼容Pyhton还是免费的~

数据可视化

PySpark

原文发布于微信公众号 - IT派(it_pai)

原文发表时间:2017-08-06

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据文摘

小白学数据 | 28张小抄表大放送:Python,R,大数据,机器学习

20220
来自专栏PPV课数据科学社区

文本挖掘小探索:避孕药内容主题分析

作者:冯大福 舆情监测一直是众多品牌关注的地方,尤其品牌想知道在品牌推广,品牌策略,品牌广告中出现的问题,从而能进行策略上的改进,但是现在很多人都是读帖子,笔者...

37660
来自专栏AI研习社

2017,最受欢迎的 15 大 Python 库有哪些?

AI 研习社按:本文作者为 ActiveWizards 的数据顾问 Igor Bobriakov,林立宏与 Raey Li 编译。 ? Igor Bobriak...

31040
来自专栏黒之染开发日记

exif信息对照

因为找不到一个完整的exif的key对照表,所以自己写一个吧,以下的key不是exif的全部,是iPhone自带像机拍摄的全部exif信息,方便大家万一有需求。

25020
来自专栏数据小魔方

R语言可视化——多边形与数据地图填充

ggplot函数中有一类特殊的图表类型叫做多边形,很难用传统的视角来定义它属于哪一类图表,因为它能够呈现信息多种多样。 特别是在做某些比较高阶的图表——地图时,...

35340
来自专栏数据派THU

盘点数据科学20个最好的Python库(附链接)

本文约3000字,建议阅读6分钟。 本文将给大家介绍数据科学领域20个最好的Python库。

12650
来自专栏有趣的Python和你

玩转itchat,实现好友信息可视化、聊天机器人及性别模型构建

前些日子,女朋友拿我手机玩,说我微信好友女生多,当时我就不服了(跪着认错了),然后两人一个个统计性别,我微信好友不算多,但也有300来个,人工统计实在费事,之后...

15710
来自专栏数据科学与人工智能

【Python环境】数据科学之5个最佳Python库,为初学者定制的教程

如果你已经决定把Python作为你的编程语言,那么,你脑海中的下一个问题会是:“进行数据分析有哪些Python库可用?” Python有很多库可用来进行数据分析...

22050
来自专栏java一日一条

如何用Python写一个贪吃蛇AI

这两天在网上看到一张让人涨姿势的图片,图片中展示的是贪吃蛇游戏, 估计大部分人都玩过。但如果仅仅是贪吃蛇游戏,那么它就没有什么让人涨姿势的地方了。 问题的关键在...

28920
来自专栏大数据文摘

2017年数据科学15个最好用的Python库

19630

扫码关注云+社区

领取腾讯云代金券