2019年AI学习纯干货:值得收藏的16 套机器学习和深度学习速查表

在机器学习和深度学习研究中,优秀的参考资料和手册通常可以使我们的学习事半功倍!今天我可大家推荐值得收藏的16 个机器学习和深度学习速查表。

NumPy

Numpy是Python科学计算的核心库之一,能够创建高性能的多维数组对象数组,并提供处理数组的工具。

Pandas

Pandas是一个基于Numpy的数据分析库,为Python编程语言提供数据结构和数据分析工具。

SciPy

Scipy也是一个基于Numpy的扩展包,包含Python语言中的一些数学算法和便利方程,是科学计算的核心库之一。

Matplotlib

Matplotlib是Python的2D绘图库,可以生成各种硬拷贝格式和跨平台交互式环境的发布质量级图形。

SciPy-Linear Algebra

使用SciPy执行各种线性代数计算方法。

Scikit-Learn

Scikit-Learn(sketarn)是一个用Python实现的机器学习算法库。Sklearn可以实现常见的机器学习算法,例如数据预处理,分类,回归,降维和模型选择。

TensorFlow

TensorFlow是Google今天开发的最热门的深度学习框架之一。

Keras

Keras是一个高级神经网络API,Keras是用纯Python编写的,基于Tensorflow,Theano和CNTK后端。

Neural Network Cells

由Asimov Institute出品的神经网络框架。更多信息参考以下网址:

http://www.asimovinstitute.org/neural-network-zoo-prequel-cells-layers/

Neural Network Graphs

Neural Networks Family

PySpark

Apache Spark是目前处理和使用大数据的最广泛使用的框架之一,Python是数据分析,机器学习等最广泛使用的编程语言之一。那么,为什么不一起使用它们呢?这就是Spark与python也被称为PySpark的原因。

Apache Spark开发人员每年的平均年薪为110,000美元。毫无疑问,Spark在这个行业中已经被广泛使用。由于其丰富的库集,Python今天被大多数数据科学家和分析专家使用。

将Python与Spark集成是开源社区的主要礼物。 Spark是用Scala语言开发的,与Java非常相似。它将程序代码编译为用于Spark大数据处理的JVM的字节码。为了支持Spark和Python,Apache Spark社区发布了PySpark。

R Studio(dplyr和tidyr)

R是一个用于统计计算和统计制图的优秀工具,对比SPSS和SAS等付费软件,R具备跨平台、自由、免费、源代码开放、绘图表现和计算能力突出等一系列优点,受到了越来越多的数据分析工作者的喜爱。

RStudio是一款R语言的IDE,R自带的环境操作起来可能不是方便,而Rstudio很好地解决了这个问题,而且它还具有调试、可视化等功能,支持纯R脚本、Rmarkdown (脚本文档混排)、Bookdown (脚本文档混排成书)、Shiny (交互式网络应用)等。

dplyr包是Hadley Wickham的新作,主要用于数据清洗和整理,该包专注dataframe数据格式,从而大幅提高了数据处理速度,并且提供了与其它数据库的接口;

tidyr包的作者也是Hadley Wickham, 该包用于“tidy”你的数据,这个包常跟dplyr结合使用。

Hadley Wickham是RStudio 的首席科学家,决定称得上是R界的男神,很多人都对Hadley的R包重度依赖,其个人主页为http://hadley.nz/. 里面有很多非常有价值的文章和代码,有兴趣可以去看一下。

ggplot2

ggplot2包是基于Hadley Wickham在《Grammar of Graphics》一书中所提出的图形语法的具体实现, 这套图形语法把绘图过程归纳为data, transformation, scale, coordinates, elements, guides, display等一系列独立的步骤, 通过将这些步骤搭配组合, 来实现个性化的统计绘图。于是, 得益于该图形语法, Hadley Wickham所开发的ggplot2是如此人性化, 不同于R基础绘图和先前的lattice那样参数满天飞, 而是摈弃了诸多繁琐细节, 并以人的思维进行高质量作图。在ggplot2包中, 加号的引入革命性的, 这个神奇的符号完成了一系列图形语法叠加, 也是这个符号, 让很多人喜欢上了用R来进行统计绘图。

Jupyter Notebook

Jupyter Notebook(此前被称为 IPython notebook)是一个交互式笔记本,支持运行 40 多种编程语言,可以用于编写编写漂亮的交互式文档的人来说是一个强大工具。Jupyter Notebook 的本质是一个 Web 应用程序,便于创建和共享文学化程序文档,支持实时代码,数学方程,可视化和 markdown。

DASK

Dask是一款用于分析计算的灵活并行计算库。

Dask由两部分组成:

针对计算优化的动态任务调度。这与Airflow,Luigi,Celery或Make类似,但针对交互式计算工作负载进行了优化。

“大数据”集合, 像并行数组,数据框和列表一样,它们将通用接口(如NumPy,Pandas或Python迭代器)扩展到大于内存或分布式环境。 这些并行集合运行在动态任务调度器之上。

在Dask官网文档可以查看更加详细的信息。

  • 发表于:
  • 原文链接:https://kuaibao.qq.com/s/20190131A0J2B800?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券