前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【知识】2017年数据科学Top12的Python库

【知识】2017年数据科学Top12的Python库

作者头像
陆勤_数据人网
发布2018-02-28 15:12:53
8800
发布2018-02-28 15:12:53
举报

Python深受数据科学家和数据工程师的喜爱。

本文总结2017年数据科学的Top12的Python库。

核心库
1 numpy

它是最基础库,是众多Python库的依赖库。 它提供了多维数组和矩阵的丰富运算。

2 scipy

它包含线性代数、优化、统计学和数值运算等操作。

3 pandas

它是Python做数据处理的优秀工具。 它可以快速而简单地实现数据操作、数据集成和数据可视化的功能。 它提供两种数据结构:序列和数据框。

数据可视化

4 matplotlib

它是Python的数据可视化基础库。 它可以实现你所想的图形,例如:折线图、散点图、柱状图、直方图、饼图、茎叶图、等高图等。

5 seaborn

它是在matplotlib的基础上专注于统计模型结果的可视化。

6 bokeh

它是实现动态化数据可视化效果。

机器学习

7 scikit-learn

它是Python的经典机器学习库。 它能够简单地把机器学习算法应用到产品。

深度学习

8 tensorflow

它出自Google,开源的深度学习框架。 它采用数据流图计算方式。

9 keras

它是一个开源库,基于高级借口构建神经网络。 它采用tensorflow作为后端。

自然语言处理

10 nltk

它是经典的自然语言处理工具。 它可以完成NLP许多任务,例如:文本标记、文本分类、文本分词,名称实体标识、语义推理等。

11 gensim

它是实现向量空间模型VSM和主题模型topic modeling的开源库。 它实现了这些算法,例如:HDP、LSA和LDA等

统计学

12 statsmodel

它是利用统计知识进行数据探索的Python开源库。

参考资料: 1 Top 15 Python Libraries for Data Science in 2017

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-12-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据科学与人工智能 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 核心库
  • 1 numpy
  • 2 scipy
  • 3 pandas
  • 数据可视化
    • 4 matplotlib
      • 5 seaborn
        • 6 bokeh
        • 机器学习
          • 7 scikit-learn
          • 深度学习
            • 8 tensorflow
              • 9 keras
              • 自然语言处理
                • 10 nltk
                  • 11 gensim
                  • 统计学
                    • 12 statsmodel
                    相关产品与服务
                    NLP 服务
                    NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
                    领券
                    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档