专栏首页数据科学与人工智能【Python环境】python中的数据分析库及机器学习库

【Python环境】python中的数据分析库及机器学习库

Python

计算机视觉

  • SimpleCV—开源的计算机视觉框架,可以访问如OpenCV等高性能计算机视觉库。使用Python编写,可以在Mac、Windows以及Ubuntu上运行。

自然语言处理

  • NLTK —一个领先的平台,用来编写处理人类语言数据的Python程序
  • Pattern—Python可用的web挖掘模块,包括自然语言处理、机器学习等工具。
  • TextBlob—为普通自然语言处理任务提供一致的API,以NLTK和Pattern为基础,并和两者都能很好兼容。
  • jieba—中文断词工具。
  • SnowNLP —中文文本处理库。
  • loso—另一个中文断词库。
  • genius —基于条件随机域的中文断词库。
  • nut —自然语言理解工具包。

通用机器学习

  • Bayesian Methods for Hackers —Python语言概率规划的电子书
  • MLlib in Apache Spark—Spark下的分布式机器学习库。
  • scikit-learn—基于SciPy的机器学习模块
  • graphlab-create —包含多种机器学习模块的库(回归,聚类,推荐系统,图分析等),基于可以磁盘存储的DataFrame。
  • BigML—连接外部服务器的库。
  • pattern—Python的web挖掘模块
  • NuPIC—Numenta公司的智能计算平台。
  • Pylearn2—基于Theano的机器学习库。
  • hebel —Python编写的使用GPU加速的深度学习库。
  • gensim—主题建模工具。
  • PyBrain—另一个机器学习库。
  • Crab —可扩展的、快速推荐引擎。
  • python-recsys —Python实现的推荐系统。
  • thinking bayes—关于贝叶斯分析的书籍
  • Restricted Boltzmann Machines —Python实现的受限波尔兹曼机。[深度学习]。
  • Bolt —在线学习工具箱。
  • CoverTree —cover tree的Python实现,scipy.spatial.kdtree便捷的替代。
  • nilearn—Python实现的神经影像学机器学习库。
  • Shogun—机器学习工具箱。
  • Pyevolve —遗传算法框架。
  • Caffe —考虑了代码清洁、可读性及速度的深度学习框架
  • breze—深度及递归神经网络的程序库,基于Theano。

数据分析/数据可视化

  • SciPy —基于Python的数学、科学、工程开源软件生态系统。
  • NumPy—Python科学计算基础包。
  • Numba —Python的低级虚拟机JIT编译器,Cython and NumPy的开发者编写,供科学计算使用
  • NetworkX —为复杂网络使用的高效软件。
  • Pandas—这个库提供了高性能、易用的数据结构及数据分析工具。
  • Open Mining—Python中的商业智能工具(Pandas web接口)。
  • PyMC —MCMC采样工具包。
  • zipline—Python的算法交易库。
  • PyDy—全名Python Dynamics,协助基于NumPy, SciPy, IPython以及 matplotlib的动态建模工作流。
  • SymPy —符号数学Python库。
  • statsmodels—Python的统计建模及计量经济学库。
  • astropy —Python天文学程序库,社区协作编写
  • matplotlib —Python的2D绘图库。
  • bokeh—Python的交互式Web绘图库。
  • plotly —Python and matplotlib的协作web绘图库。
  • vincent—将Python数据结构转换为Vega可视化语法。
  • d3py—Python的绘图库,基于D3.js。
  • ggplot —和R语言里的ggplot2提供同样的API。
  • Kartograph.py—Python中渲染SVG图的库,效果漂亮。
  • pygal—Python下的SVG图表生成器。
  • pycascading

杂项脚本/iPython笔记/代码库

  • pattern_classification
  • thinking stats 2
  • hyperopt
  • numpic
  • 2012-paper-diginorm
  • ipython-notebooks
  • decision-weights
  • Sarah Palin LDA —Sarah Palin关于主题建模的电邮。
  • Diffusion Segmentation —基于扩散方法的图像分割算法集合。
  • Scipy Tutorials —SciPy教程,已过时,请查看scipy-lecture-notes
  • Crab—Python的推荐引擎库。
  • BayesPy—Python中的贝叶斯推断工具。
  • scikit-learn tutorials—scikit-learn学习笔记系列
  • sentiment-analyzer —推特情绪分析器
  • group-lasso—坐标下降算法实验,应用于(稀疏)群套索模型。
  • mne-python-notebooks—使用 mne-python进行EEG/MEG数据处理的IPython笔记
  • pandas cookbook—使用Python pandas库的方法书。
  • climin—机器学习的优化程序库,用Python实现了梯度下降、LBFGS、rmsprop、adadelta 等算法。

本文分享自微信公众号 - 数据科学与人工智能(DS_AI_shujuren)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2015-10-05

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 【Python环境】人们对Python在企业级开发中的10大误解

    在PayPal的编程文化中存在着大量的语言多元化。除了长期流行的C++和Java,越来越多的团队选择JavaScript和Scala,Braintree的收购也...

    陆勤_数据人网
  • 我是如何学习Python语言?

    我是一位数据工作者,经常会使用到各种软件和工具帮助我解决各种数据问题,比方说数据的抽取与解析,数据的加工与探索,数据的建模与展示等。我会使用Python语言来做...

    陆勤_数据人网
  • 【Python环境】学习Python:做数据科学还是网站开发?

    本文的英文原文地址是:Python for Data Science vs Python for Web Development,发布时间是10月29日。译者一...

    陆勤_数据人网
  • 史无前例!Python将被加入高考科目

    Python 将被纳入高考科目 2017年初消息: 浙江省信息技术新教材,即将在2017级(2017年9月入学)高中新生中开始使用。 据了解,与目前的选考(可以...

    BestSDK
  • Python3学习笔记 | 一、Python使用入门

    Python版本可分为2.x和3.x,而且两个版本都在持续更新,Python3.x的特点是规范化了代码,但是不向下兼容,不过我觉着随着时代的更迭,Python3...

    TeamsSix
  • Python面试可能会问到的问题,你会几个?

    随着Python时代的到来(AI会用到Python,区块链会用到Python,大数据会用到Python,自动化会用到Python.......Pyt...

    我被狗咬了
  • 整理 | Python基础部分小结,推荐收藏

    最近整理了一个Python新手学Python系列方便新人学习与熟手回顾基础知识.

    叫我龙总
  • 给那些想学Python的建议

    这几天陆续收到很多读者、球友的留言、私信,说要怎么学Python?有没有基础的,偏小白的学习方法?我的回答是:等我统一答复。

    Python进阶者
  • 不会Python的你,正在失去核心竞争力!

    在我看来,基本上可以不负责任的告诉你,Python 可以做任何事情。无论是从入门级选手到专业级选手都在做的爬虫,还是 Web 程序开发、桌面程序开发还是科学计算...

    小小科
  • 从数据小白到职场大咖,所需要的好书我都替你选好了!

    通过Google用户搜索频率来统计排名的PYPL排行榜显示,Python份额高达29.88%,稳居第一,并且猛增4.1%,同时成为增长势头最好的语言。

    CDA数据分析师

扫码关注云+社区

领取腾讯云代金券