前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >关于深度学习、NLP和计算机视觉的30个顶级Python库

关于深度学习、NLP和计算机视觉的30个顶级Python库

作者头像
LiveVideoStack
修改2020-12-28 11:40:18
6190
修改2020-12-28 11:40:18
举报
文章被收录于专栏:音视频技术音视频技术

再次感谢艾哈迈德·阿尼斯(Ahmed Anis)为收集这些数据做出的贡献,并感谢KDnuggets的其他工作人员的意见,见解和建议。

请注意,下面是由Gregory Piatetsky绘制的图示,并按类型标表示了每个库,按星标和贡献者对其进行绘制,它的符号大小则是以该库在Github上的提交次数的对数表示。

​关于深度学习、NLP和计算机视觉的30个顶级Python库
​关于深度学习、NLP和计算机视觉的30个顶级Python库

图1:用于深度学习、自然语言处理和计算机视觉的顶级Python库

由星级和贡献者数量绘制;按提交的对数表示相对大小

那么,废话少说,下面是就是由KDnuggets员工精心挑选出来,可用于深度学习、自然语言处理和计算机视觉的30个顶级Python库。

代码语言:javascript
复制
由于微信公众号跳转链接只能设置公众号推文,链接需自行粘贴至浏览器中访问。

深度学习

1. TensorFlow(https://github.com/tensorflow/tensorflow)

星标:149000,提交数:97741,贡献者:2754

TensorFlow是一个用于机器学习的端到端的开源平台。它具备着全面综合的、灵活的工具、库和社区资源生态系统,可以帮助研究人员去推动机器学习先进的技术的发展,并让开发人员可以轻松地构建和部署基于机器学习的应用程序。


2. Keras(https://github.com/keras-team/keras)

星标:50000,提交数:5349,贡献者:864

Keras是一个用Python编写的深度学习API,其运行于机器学习的顶级平台TensorFlow之上。


3. PyTorch(https://github.com/pytorch/pytorch)

星标:43200,提交数:30696,贡献者:1619

具有强大GPU加速,和使用Python实现的张量和动态神经网络。


4. fastai(https://github.com/fastai/fastai)

星标:19800,提交数:1450,贡献者:607

通过利用当下最佳的技术实践,fastai极快地简化了训练过程,并加速了神经网络。


5. PyTorch Lightning

(https://github.com/PyTorchLightning/pytorch-lightning)

星标:9600,提交数:3594,贡献者:317

针对于高性能人工智能研究的封装轻量级PyTorch。可以缩小你的模型,而不是提供小的样板。


6. JAX(https://github.com/google/jax)

星标:10000,提交数:5708,贡献者:221

Python+NumPy程序的可组合转换:区分,向量化,在GPU/TPU上的JIT,等等。


7. MXNet(https://github.com/apache/incubator-mxnet)

星标:19100,提交数:11387,贡献者:839

带有动态和突变感知的数据流管理调度程序的轻量、便捷、灵活的分布式/移动机器学习库:支持Python、R、Julia、Scala、Go、JavaScript等等。


8. Ignite(https://github.com/pytorch/ignite)

星标:3100,提交数:747,贡献者:112

高级库,可以帮助培训和评估神经网络在PyTorch中实现灵活和透明的使用。

自然语言处理

9. FastText(https://github.com/facebookresearch/fastText)

星标:21700,提交数:379,贡献者:47

fastText是一个可以用来高效学习单词表意和句子分类的库。


10. spaCy(https://github.com/explosion/spaCy)

星标:17400,提交数:11628,贡献者 482

用来实现工业级自然语言处理(NLP),通过使用Python和Cython。


11. gensim(https://github.com/RaRe-Technologies/gensim)

星标:11200,提交数:4024,贡献者:361

Gensim是一个Python库,用于主题建模、文档索引和相似度检索,具有大型语料库。目标受众是自然语言处理(NLP)和信息检索(IR)社区。


12. NLTK(https://github.com/nltk/nltk)

星标:9300,提交数:13990,贡献者:319

NLTK——自然语言工具箱——是一套开源Python模块、数据集和教程,用于针对支持自然语言处理方面的研究和开发。


13. Datasets (Huggingface)

(https://github.com/huggingface/datasets)

星标:4300,提交数: 568,贡献者:64

用于自然语言处理的,使用PyTorch, TensorFlow, NumPy和Pandas的工具,具有快速,高效,开放访问的数据集和自然语言处理评估指标。


14. Tokenizers (Huggingface) (https://github.com/huggingface/tokenizers)

星标:3800,提交数:1252,贡献者:30

为研究和生产优化的快速、顶级的分词器。


15. Transformers (Huggingface)

(https://github.com/huggingface/transformers)

星标:3500,提交数:5480,贡献者:585

transformer:针对 Pytorch和TensorFlow 2.0的最顶级的自然语言处理库。


16. Stanza(https://github.com/stanfordnlp/stanza/)

星标:4800,提交数:1514,贡献者:19

针对许多人类语言的正式标准NLP Python库。


17. TextBlob(https://github.com/sloria/textblob)

星标:7300,提交数:542,贡献者:24

简单、python风格、文本处理——情感分析、词性标记、名词短语提取、翻译等等。


18. PyTorch-NLP

(https://github.com/PetrochukM/PyTorch-NLP)

星标:1800,提交数:442,贡献者:15

PyTorch自然语言处理(NLP)的基本工具。


19. Textacy(https://github.com/chartbeat-labs/textacy)

星标:1500,提交数:1324,贡献者:23

一个Python库,用于执行各种自然语言处理(NLP)任务,构建在一个高性能spaCy库之上。


20. Finetune(https://github.com/IndicoDataSolutions/finetune)

星标:626,提交数:1405,贡献者:13

Finetune是一个库,它允许用户利用最先进的预训练的NLP模型来执行广泛的下游任务。


21. TextHero(https://github.com/jbesomi/texthero)

星标:1900,提交数:266,贡献者:17

文本预处理,表示和可视化,从零到精通。


22. Spark NLP(https://github.com/JohnSnowLabs/spark-nlp)

星标:1700,提交数:4363,贡献者:50

Spark NLP是一个构建在Apache Spark ML之上的自然语言处理库。


23. GluonNLP(https://github.com/dmlc/gluon-nlp)

星标:2200,提交数:712,贡献者:72

GluonNLP是一个工具包,它支持简单的文本预处理、数据集加载和神经模型构建,以帮助您加快自然语言处理(NLP)研究。

计算机视觉

24. Pillow(https://github.com/python-pillow/Pillow)

星标:7800,提交数:10799,贡献者:303

Pillow是对用户十分友好的PIL分支。PIL是Python的图像库。


25. OpenCV(https://github.com/opencv/opencv)

星标:49600,提交数:29453,贡献者:1234

开源计算机视觉库。


26. scikit-image(https://github.com/scikit-image/scikit-image)

星标:4000,提交数:12352,贡献者:403

python中的图像处理。


27. Mahotas(https://github.com/luispedro/mahotas)

星标:644,提交数:1273,贡献者:25

Mahotas是个包含了最快的计算机视觉算法(所有算法用C++实现保证运行速度)的库,针对numpy数组运行。


28. Simple-CV(https://github.com/sightmachine/simplecv)

星标:2400,提交数:2625,贡献者:69

SimpleCV是一个开源机器视觉框架,使用OpenCV和Python编程语言。


29. GluonCV(https://github.com/dmlc/gluon-cv)

星标:4300,提交数:774,贡献者:101

GluonCV提供了计算机视觉中最先进(SOTA)深度学习模型的实现。


30. Torchvision(https://github.com/pytorch/vision)

星标:7500,提交数:1286,贡献者:334

torchvision包由流行的数据集、模型架构和用于计算机视觉中常见的图像转换方法组成。

本文系外文翻译,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系外文翻译前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 深度学习
  • 自然语言处理
  • 计算机视觉
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档