这是一个非常具有竞争力的名单,名单是从 2017 年一整年间发布的最佳的开源机器学习库,数据集和应用程序当中仔细挑选出来的。 Mybridge AI(https://www.mybridge.co/ ) 通过考虑使用频率,参与度和新近度来评估总分。针对总评分给你一个意见, Github stars 平均表现是 3558。
开源项目对于数据科学家来说可能是很有用的。你可以通过阅读源代码以及在现有项目之上构建一些东西来学习。 给机器学习的项目留出足够的时间吧,你可能已经错过去年一年了。
推荐学习
A) 神经网络
深度学习 A-Z™:动手的人工神经网络 [68745 推荐, 4.5/5]
http://bit.ly/2CH1WcQ
B) TensorFlow
用 Python 进行深度学习的 TensorFlow 完整指南 [17834 推荐, 4.6/5]
http://bit.ly/2EatVy7
No.1
FastText:快速文本呈现和分类库。 [在 Github 有 11786]。 由 Facebook Research(http://suo.im/3tg3ie ) 开源
……… [Muse: 基于快速文本的多语言无监督或监督词嵌入。在 Github 有 695]
No.2
深度图像风格转换:纸张的代码和数据 “深度 图像 风格 转换” [在 Github 有 9747 ]。 致谢 Fujun Luan,Ph。D。 康奈尔大学。
No.3
世界上最简单的面部识别 API:Python 和命令行 [在 Github 有 8672]。 致谢 Adam Geitgey(http://suo.im/3I1tIp )
No.4
Magenta:智能的音乐与艺术创作 [在 Github 有 8113]。
No.5
Sonnet: 基于 TensorFlow 的神经网络库 [在 Github 有 5731]。 致谢 Deepmind 的 Malcolm Reynolds(http://suo.im/3Lx0bl )
No.6
deeplearn。js: 为 web 提供硬件加速的机器智能库 [在 Github 有 5462]。 致谢 Google Brain 的 Nikhil Thorat
No.7
TensorFlow 的快速风格迁移 [在 Github 有 4843]。 致谢 MIT 的 Logan Engstrom(http://suo.im/2dfLuh )
No.8
Pysc2: 星际争霸 II 学习环境 [在 Github 有 3683] 致谢 DeepMind 的 Timo Ewalds
No.9
AirSim: 基于 Unreal Engine 的开源模拟器,用于 Microsoft AI & Research [在 Github 有 3861 ⭐️]。 致谢 Microsoft 的 Shital Shah(http://suo.im/1NB1eO )
No.10
Facets: 机器学习数据集的可视化 [在 Github 有 3371]。 由 Google Brain 提供
No.11
Style2Paints: 图像的 AI 彩色化 [在 Github 有 3310]。
No.12
Tensor2Tensor: Google Research 的广义序列到序列模型库 [在 Github 有 3087]。 致谢 Google Brain 的 Ryan Sepassi (http://suo.im/3qlpIR )
No.13
PyTorch 中的图像到图像转换 (e。g。 horse2zebra, edges2cats, and more) [在 Github 有 2847 ⭐️]。 致谢 Berkeley 的 Jun-Yan Zhu 博士
No.14
Faiss: 用于密集向量的高效相似性搜索和聚类的库 [在 Github 有 2629]。 由 Facebook Research 提供
No.15
Fashion-mnist: 类似 MNIST 的世上产品数据库 [在 Github 有 2780]。 致谢 Zalando Tech(http://suo.im/1jaz9e ) 的研究科学家 Han Xiao
No.16
ParlAI: 在各种公开可用的对话数据集上训练和评估 AI 模型的框架 [在 Github 有 2578]。 致谢 Facebook Research(http://suo.im/3tg3ie ) 的 Alexander Miller
No.17
Fairseq: Facebook AI 研究序列 - 序列工具包 [在 Github 有 2571]。
No.18
Pyro: Python and PyTorch 的深度概率编程 [在 Github 有 2387]。 由 Uber AI Labs 提供
No.19
iGAN: 由 GAN 支持的交互式图像生成 [在 Github 有 2369]。
No.20
Deep-image-prior:使用无需学习的神经网络进行图像还原 [在 Github 有 2188]。 致谢 Skoltech 的 Dmitry Ulyanov 博士
No.21
Face_classification:使用具有 keras CNN 模型和 openCV 的 fer2013/imdb 数据集的实时人像监测和情感 / 性别分类 [在 Github 有 1697]。
No.22
Speech-to-Text-WaveNet : 使用 DeepMind 的 WaveNet 和 tensorflow 进行端到端的句子级英语语音识别 [在 Github 有 1961]。 致谢 Kakao Brain 的 Namju Kim
No.23
StarGAN: 用于多域图像到图像转换的统一生成对抗网络 [在 Github 有 1954]。 由韩国大学的 Yunjey Choi(http://suo.im/1P2U2L ) 提供
No.24
Ml-agents: Unity 机器学习代理 [在 Github 有 1658]。 感谢 Unity 3D 深度学习团队的 Arthur Juliani(http://suo.im/13lpB9 )
No.25
DeepVideoAnalytics: 分布式可视化搜索和可视化数据分析平台 [在 Github 有 1494]。 感谢康奈尔大学的 Akshay Bhat(http://suo.im/3dG3sa ) 博士
No.26
OpenNMT:火炬中的开源神经机器翻译 [在 Github 有 1490]。
No.27
Pix2pixHD: 使用条件 GAN 合成和处理 2048*1024 图像 [在 Github 有 1283]。 感谢 Nvidia 的 AI Research 科学家 Ming-Yu Liu(http://suo.im/2byDaf )
No.28
Horovod: TensorFlow 的分布式训练框架 [在 1188 有 845]。 由 Uber Engineering 提供
No.29
AI-Blocks: 强大的直观的界面,允许任何人创建的机器学习模型 [在 Github 有 899]。
No.30
采用 Tensorflow 的深度神经网络进行语音识别 [在 Github 有 845]。 感谢 Kakao Brain 的 AI 研究院的 Dabi Ahn(http://suo.im/yz9b2 )
博客原址 https://medium.mybridge.co/30-amazing-machine-learning-projects-for-the-past-year-v-2018-b853b8621ac7