“
阅读本文大概需要 3 分钟。
”
一门语言好用、方便的程度在很多时候会取决于这门语言相关的库够不够丰富,Python 之所以火爆除了其本身的语法和特性之外,还在一定程度上取决于其有太多太多库的支持,不论是官方维护的还是第三方开发的。就比如说做机器学习为什么很多人都用 Python,一个非常大的因素就是 TensorFlow 和 PyTorch 对 Python 的支持。当然在这里并不是说 Python 的库真的就全的不要不要的,它在某些领域或者项目的生态还是有待完善的。
正好昨天刷到知乎一个问题「你见过哪些相见恨晚的 Python 库?」,其意就是想了解下有哪些非常好用的提高生产力的 Python 库。一些回答直接把 awesome-python 贴过来,点赞非常多,当然多归多,但是里面很多都是些过期的或者其实没太有什么价值的库,反而会增加了挑选库的成本。我大体上把一些回答过了一遍,另外结合自己平时了解的内容,稍微对一些基础生产力库做了简单的梳理,在这里分享给大家。
所以这里就不再针对于一些特殊的场景推荐了,如一些 Web开发库、网络请求库、数据操作库、数据分析库、机器分析库等等。下面主要罗列一些适用范围和方向较广,对于一些基础设施的建设比较有用,能在多数场景下提高 Python 生产力的库,描述比较简单,主要是提供一个列表,仅供参考哈。
GitHub:https://github.com/python-attrs/attrs、https://github.com/Tinche/cattrs
简化类的定义、序列化反序列化等操作。
个人写的简介:https://mp.weixin.qq.com/s/oHK-Y4lOeaQCFtDWgqXxFA
GitHub:https://github.com/Delgan/loguru
可简化日志记录写法。
个人写的简介:https://mp.weixin.qq.com/s/5Ri1WS5cTGCNAQ0I_zYycg
GitHub:https://github.com/hhatto/autopep8
把 Python 代码转成符合 PEP8 规范的代码。
GitHub:https://github.com/giampaolo/psutil
Python 实现任务监控的库。
GitHub:https://github.com/gruns/furl
对 url 的处理非常方便,比 urllib 等库好用多。
GitHub:https://github.com/rholder/retrying、https://github.com/jd/tenacity
异常重试库,如出错之后重试多少次,尤其在发起一些 HTTP 请求时非常有用,当然也能用于其他地方。
Docs:https://docs.python.org/zh-cn/3/library/typing.html#module-typing
对 Python 类型的支持,支持多种类型、嵌套类型,也推荐多多使用 Python 的类型注解。
Docs:https://docs.python.org/zh-cn/3/library/argparse.html
个人曾经使用过几个命令行解析工具,如 docopt,但后来还是转回来了 argparse,功能齐全强大。
GitHub:https://github.com/abseil/abseil-py
个人感觉比 argparse 更易用的库,如 TensorFlow 就在使用这个,对于定义一些 Flag 非常方便。
GitHub:https://github.com/pypa/pipenv
功能更全的包管理工具,集成虚拟环境、支持 Lock 机制锁定安装包版本和依赖信息。当然也有坑点,可自行搜索。
Docs:https://www.django-rest-framework.org/
基于 Django 的 REST Framework,快速实现 REST API。
GitHub:https://github.com/gorakhargosh/watchdog
方便监视文件系统改动。
Docs:https://docs.python.org/3/library/glob.html
对文件的操作非常方便。
Docs:https://docs.python.org/2/library/2to3.html
把 Python2 代码转成 Python3 代码。
GitHub:https://github.com/mahmoud/glom
对 JSON 嵌套的处理非常方便。
Docs:https://docs.python.org/3/library/pathlib.html
更为方便的 Python 路径操作库。
GitHub:https://github.com/sloria/environs
对于环境变量的获取非常方便,支持多种类型,如 int、bool 等。
GitHub:https://github.com/cool-RR/PySnooper
非常方便简单的 Python 调试器,可以追踪到代码每一处细节的执行状态。
GitHub:https://github.com/tqdm/tqdm
进度条控制显示非常方便。
GitHub:https://github.com/amoffat/sh
对 Linux 一些命令的封装,简单好用又高效。
GitHub:https://github.com/joke2k/faker
模拟数据的生成。
个人写的简介:https://mp.weixin.qq.com/s/iLjr95uqgTclxYfWWNxrAA
GitHub:https://github.com/crsmithdev/arrow、https://github.com/dateutil/dateutil、https://github.com/scrapinghub/dateparser、https://github.com/sdispater/pendulum
时间解析和处理库,非常方便。arrow 目前 Star 最多,好评最多。
GitHub:https://github.com/kootenpv/yagmail
方便的发邮件库,替代自带的 smtplib。
GitHub:https://github.com/chardet/chardet
字符串类型编码检测。
GitHub:https://github.com/mozillazg/python-pinyin
汉字转拼音,在一些中文转化处理上很有用。
个人写的简介:https://mp.weixin.qq.com/s/NvA3j8Ns1-6CFgWpUcWwQw
Docs:https://www.sphinx-doc.org/en/master/
编写文档使用,大多数 Python 库文档都是这个写的,如 Scrapy、requests。
个人 sphinx + markdown 的样例:https://github.com/Gerapy/Docs
GitHub:https://github.com/pallets/jinja
一个方便的模板引擎,呈现页面时很方便。
GitHub:https://github.com/pallets/click
更方便灵活地实现命令行传递参数。
GitHub:https://github.com/ray-project/ray
分布式多进程管理。
GitHub:https://github.com/Supervisor/supervisor
进程管理工具,如实现多任务后台运行,Docker 打包时会经常用到。
GitHub:https://github.com/agronholm/apscheduler
Python 定时任务,不过 K8S 也可以实现,个人目前可能更倾向于 K8S。
Home:https://software.intel.com/en-us/distribution-for-python
这不是 Python 库,是一个 Intel 开发的基于 Intel 处理器优化的 Python 解释器,对于大规模运算提升很大。
完毕。
好啦,先推荐这么多了,后面还会慢慢积累,大家可以了解下,个人感觉有不少库还是能极大提高生产力的。
由于这次主要是推荐一些适用范围和方向较广,个人感觉对于一些基础设施的建设比较有用的库,所以一些 Web、爬虫、数据分析、机器学习等库就没有列在这里了。当然也由于个人水平有限,也有很多库没有列全,如果大家有推荐的,欢迎留言分享哈!
end