前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >“表”解机器学习

“表”解机器学习

作者头像
IT派
发布2018-03-28 18:41:14
8350
发布2018-03-28 18:41:14
举报
文章被收录于专栏:IT派

导语:在过去的几个月里,作者一直在专注于整理归纳AI的各类小要点。在被越来越多的朋友同事问及时,我决定将这些总结和心得的完整版分享给大家。为了增加内容的趣味性和可读性,我也在每个主题下面加了些注解,希望对你们有用。

另外,小编在这里邀请大家加入到我们,小编Tom邀请你一起搞事情!

神经网络

各种公式~

机器学习

概 览

Scikit-learn 算法

这张图可以帮助你找到正确的估计器,这应该是机器学习汇总最难的部分。下面的流程图可以帮助快速查找文档,并对每种估计器做了大致的介绍,有助你更快了解问题并找到解决方案。

Scikit-learn(学名scikits.learn)是一个免费的机器学习Python编程语言库。包括了各类分类、回归与聚类算法,并支持向量机、随机森林、梯度提升、 K-means和DBSCAN。它还可以与Python NumPy和SciPy进行交互。

Microsoft Azure 算法

这个微软Azure的机器学习表可以帮助你为预测分析方案选择合适的机器学习算法。首先根据数据的性质,匹配最佳算法。

用于数据科学的Python

TensorFlow

今年5月,Google宣布在第二代TPU和Google计算引擎中加入对TPU的支持。第二代TPU拥有高达180 teraflops的性能。当 64个TPU组合在一起时,可以提供高达11.5千万亿次的浮点运算性能。

Keras

今年,Google也在TensorFlow的核心库中支持Keras。Chollet认为比起端到端的机器学习框架,Keras更应作为一个接口。它提供的是更高级别、更直观的抽象集,使得无论后端科学计算库是什么,都可以轻松地配置神经网络。

Numpy

NumPy 是针对Python中的一个非优化的字节码解释器——CPython的参考实现。针对这一版本的Python编写数学算法的运行速度相对较慢的问题,Numpy 使用的是多维数组和函数与运算符来改写部分代码,从而提高运行的效率。

Pandas

“Pandas”的名字源于“Panel Data”,是多维结构化数据集的计量经济学术语。

数据预处理

数据预处理(data wrangler)一词已经开始渗透进了流行文化中。今年的电影“金刚·”中,演员Marc Evan Jackson饰演的角色Steve Woodward正是被介绍为——我们的数据处理者。

用 Dplyr 与 Tidyr 进行数据预处理

SciPy

SciPy 是基于NumPy数组对象构建的,是NumPy堆栈的一部分,包括 Matplotlib,pandas和SymPy 等工具,以及扩展的科学计算库集。该NumPy 堆栈与其他应用程序(比如MATLAB,GNU Octave 和 Scilab)用户差不多。NumPy堆栈有时也被称为SciPy堆栈。

Matplotlib

Matplotlib是Python编程语言及其数学数学扩展NumPy的绘图库,提供了面向对象的API,用于使用 Tkinter、wxPython、Qt或GTK +等通用GUI工具包将图形嵌入到应用程序中。还有一个基于状态机(如OpenGL)的程序 “pylab”接口,很像MATLAB,但不鼓励使用。

Pyplot 是matplotlib的一个模块,提供了一个类似MATLAB的界面。Pyplot 跟MATLAB一样容易上手,兼容Pyhton还是免费的~

数据可视化

PySpark

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-08-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 IT派 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档