前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >那些被低估的Python库

那些被低估的Python库

作者头像
HuangWeiAI
发布2020-07-27 15:27:38
9230
发布2020-07-27 15:27:38
举报
文章被收录于专栏:浊酒清味浊酒清味

1

前言

在这篇文章中,我们想展示一些不同于流行的东西。这些都是深夜浏览GitHub的感悟,以及同事们分享的压箱底东西。这些软件包中的一些是非常独特的,使用起来很有趣的Python包。

2

混合派

  1. Knock Knock:从Python发送通知到移动设备、桌面或电子邮件。
  2. tqdm:可扩展的Python和CLI进度条,内置对pandas的支持。
  3. Colorama:简单的跨平台彩色终端文本。
  4. pandas -log:提供熊猫基本操作的反馈。非常适合调试长管道链。
  5. Pandas-flavor:扩展pandas DataFrame/Series的简单方法。
  6. More-Itertools:增加了类似于itertools的额外功能。
  7. streamlit:为机器学习项目创建应用程序的简单方法。

3

数据清理和操作

  1. ftfy:修复mojibake和Unicode文本中的其他故障。
  2. janitor:有很多很酷的功能来清理数据。
  3. Optimus:另一个数据清理包。
  4. Great-experctations:一个检查数据是否符合预期的好工具。

4

数据探索和建模

  1. Pandas-profile:创建一个包含来自pandas DataFrame的统计数据的HTML报告。
  2. dabl:允许使用可视化和预处理进行数据探索。
  3. pydqc:允许比较两个数据集之间的统计数据。
  4. pandas-summary:对panda DataFrames描述功能的扩展。
  5. pivottable-js:pands在jupyter notebook的拖放功能。

5

数据结构

  1. Bounter:有效的计数器,使用有限(有界)的数量的内存,无论数据大小。
  2. Python -bloomfilter:可扩展的Bloom Filter,使用Python实现。
  3. datasketch:提供概率数据结构,如LSH、加权MinHash、HyperLogLog等。
  4. ranges:Python的连续范围、范围集和范围令数据结构

6

性能检查和优化

  1. Py-spy: Python程序的采样分析器。
  2. pyperf:用于运行Python基准测试的工具箱。
  3. snakeviz:一个浏览器内的Python配置文件查看器,对jupyter notebook有很大的支持。
  4. Cachier: Python函数的持久、无延迟、本地和跨机缓存。
  5. Faiss:用于高效的相似性搜索和密集向量聚类的库。

原文:

https://towardsdatascience.com/the-most-underrated-python-packages-e22bf6049b5e?gi=f9ed1a098270

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-07-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python学会 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档