【项目】2017年最佳的30个机器学习项目

本文比较了在过去的一年里8800个开源机器学习项目,并从中选取了前30个制成这份清单。它涵盖了2017年1月和12月之间发布的最佳开源机器学习库,数据集和应用程序。Mybridge AI通过受欢迎程度,参与度和新近度来评估质量(为了让你明白质量好是什么概念,我可以告诉你,它们的Github星的平均数量是3558)。

开源项目对于数据科学家来也很有用。你可以通过阅读源代码进行学习并在现有项目之上构建一些东西。你可以花很多时间来鼓捣你过去一年中可能错过的机器学习项目。在此之前我首先要推荐两个我认为比较好的机器学习课程(英文课程)。

推荐学习

A)神经网络

Deep Learning A-Z™: Hands-On Artificial Neural Networks

[68,745推荐,4.5 / 5星]

http://bit.ly/2CH1WcQ

B)TENSORFLOW

Complete Guide to TensorFlow for Deep Learning with Python

[17,834条建议,4.6 / 5星]

http://bit.ly/2EatVy7

榜单

NO1

FastText:用于快速文本表示和分类的库。[Github上11786颗星]。由Facebook Research提供。

[ 灵感来源于:基于快速文本的多语言无监督或监督的词嵌入。Github上695颗星。https://github.com/facebookresearch/MUSE]

https://goo.gl/VWGfCs

NO2

Deep-photo-styletransfer:论文的“Deep Photo Style Transfer”代码和数据 [Github上9747颗星]。由康奈尔大学Fujun Luan博士提供。

https://github.com/luanfujun/deep-photo-styletransfer?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

NO3

为Python和命令行提供的最简单的面部识别api。[Github上8672个星]。由Adam Geitgey提供。

https://github.com/luanfujun/deep-photo-styletransfer?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

NO4

Magenta:一代与机器智能[Github上8113颗星]

https://github.com/luanfujun/deep-photo-styletransfer?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

NO5

Sonnet:基于TensorFlow的神经网络库[Github上5731颗星]。由Deepmind公司的Malcolm Reynolds提供。

https://github.com/deepmind/sonnet?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

NO6

deeplearn.js:为网络硬件加速的机器智能库[Github上5462颗星]。由Google Brain的Nikhil Thorat提供。

https://github.com/PAIR-code/deeplearnjs?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

NO7

在TensorFlow中快速转变风格[Github上4843颗星]。由MIT的Logan Engstrom提供。

https://github.com/lengstrom/fast-style-transfer?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

NO8

Pysc2:星际争霸II学习环境[Github上3683颗星]。由DeepMind的Timo Ewalds提供。

https://github.com/deepmind/pysc2?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

NO9

AirSim:基于Unreal引擎的开源模拟器,用于微软AI&Research的自驾车[Github上3861颗星]。由微软的Shital Shah提供。

https://github.com/Microsoft/AirSim?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

NO10

Facets:机器学习数据集的可视化[Github上3371颗星]。由Google Brain提供。

https://github.com/PAIR-code/facets?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

NO11

Style2Paints:为图片上色的AI[Github上3310颗星]

https://github.com/lllyasviel/style2paints?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

NO12

Tensor2Tensor:一个用于泛化seq2seq模型的库[Github上3087颗星]。由Google Brain的Ryan Sepassi提供。

https://github.com/tensorflow/tensor2tensor?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

NO13

在PyTorch中进行图片对图片的转化(例如horse2zebra,edges2cats等等)[Github上2847颗星]。由伯克利的Jun-Yan Zhu博士提供。

https://github.com/junyanz/pytorch-CycleGAN-and-pix2pix?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

NO14

Faiss:用于密集向量的高效相似性搜索和聚类的库。[Github上2629颗星]。由Facebook Research提供。

https://github.com/facebookresearch/faiss?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

NO15

Fashion-mnist:类似MNIST的时尚产品数据库[Github上2780颗星]。由Zalando Tech的研究科学家Han Xiao提供。

https://github.com/zalandoresearch/fashion-mnist?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

NO16

ParlAI:各种公开可用的对话数据集上训练和评估AI模型的框架[Github上2578颗星]。由Facebook Research的Alexander Miller提供。

https://github.com/facebookresearch/ParlAI?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

NO17

Fairseq:Facebook AI研究seq2seq工具包[Github上2571颗星]

https://github.com/facebookresearch/fairseq?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

NO18

Pyro:Python和PyTorch的深度通用概率编制程序(Deep universal probabilistic programming)[Github上2387颗星]。由Uber的AI Labs提供。

https://github.com/uber/pyro?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

NO19

iGAN:由GAN支持的交互式图像生成器(Interactive Image Generation)[Github上2369颗星]

https://github.com/junyanz/iGAN?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

NO20

深度图像优先:使用无监督学习的神经网络进行图像恢复[Github上2188颗星]。由Skoltech的Dmitry Ulyanov博士提供。

https://github.com/DmitryUlyanov/deep-image-prior?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

NO21

Face_classification:使用具有keras CNN模型和openCV的fer2013/imdb数据集的实时人脸检测和情感/性别分类。[Github上1967星]

https://github.com/oarriaga/face_classification?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

NO22

Speech-to-Text-WaveNet:使用DeepMind的WaveNet和tensorflow进行端对端的句子级英语语音识别[在Github上1961星]。由来自Kakao Brain的Namju Kim提供。

https://github.com/buriburisuri/speech-to-text-wavenet?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

NO23

StarGAN:用于多领域图像对图像转化的,标准的生成式对抗网络[Github上1954颗星]。由韩国大学的Yunjey Choi提供。

https://github.com/yunjey/StarGAN?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

NO24

Ml-agents:Unity机器学习智能体[Github上1658颗星]。由Unity Juliani提供。

https://github.com/Unity-Technologies/ml-agents?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

NO25

DeepVideoAnalytics:分布式可视化搜索和可视化数据分析平台[Github上1494颗星]。由康奈尔大学的Akshay Bhat博士提供。

https://github.com/AKSHAYUBHAT/DeepVideoAnalytics/?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

NO26

OpenNMT:Torch的开源神经网络机器翻译系统[Github上1490颗星]

https://github.com/OpenNMT/OpenNMT?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

NO27

Pix2pixHD:使用条件式GAN合成和处理2048×1024的图像[Github上1283颗星]。由Nvidia的AI研究科学家Ming-Yu Liu提供。

https://github.com/NVIDIA/pix2pixHD?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

NO28

Horovod:TensorFlow的分布式训练框架。[在Github上1188颗星]。由Uber Engineering提供。

https://github.com/uber/horovod?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

NO29

AI-Blocks:强大而直观的WYSIWYG(所见即所得)接口,允许任何人创建机器学习模型[Github上899颗星]

https://github.com/MrNothing/AI-Blocks?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

NO30

Tensorflow中语音转化的深度神经网络(主要为语音风格的变换)[Github上845颗星]。由Kakao Brain AI研究院的Dabi Ahn提供。

https://github.com/andabi/deep-voice-conversion?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

原文发布于微信公众号 - ATYUN订阅号(atyun_com)

原文发表时间:2018-01-09

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数据派THU

Github近期最有趣的10款机器学习开源项目

? 来源:PaperWeekly 本文共900字,建议阅读6分钟。 本文为你罗列近期Github上十大有趣的机器学习开源项目。 -01- Face Rec...

2976
来自专栏量子位

GitHub深度学习开源项目Top200正式公布 | 资源帖

最近,来自埃及的Mahmoud Badry,做了一张GitHub深度学习项目Top 200天梯榜,月更。

591
来自专栏AI科技大本营的专栏

资源 |“从蒙圈到入坑”,推荐新一波ML、DL、RL以及数学基础等干货资源

编译| AI科技大本营(rgznai100) 参与 | suiling 此前营长曾发过一篇高阅读量、高转发率,高收藏量的文章《爆款 | Medium上6900...

3439
来自专栏媒矿工厂

视频编码优化之道

5月20号,在LiveVideoStack音视频技术社区举办的WebRTCon 2018大会上,上海交通大学图像所宋利教授在WebRTC与Codec专题作为出品...

1001
来自专栏量子位

火爆GitHub:100天搞定机器学习编程(超赞信息图+代码+数据集)

但怎么想是一回事,怎么做往往是另一回事。学习和健身一样,不少人都停留在口头上,有各种借口不曾付诸实施。

590
来自专栏AI研习社

入门必读的机器学习名词解释,你都懂了吗?

train? valid? or test? 机器学习最明显的一个特点是需要大量的数据。特别对监督学习来说,就是需要大量的带标签数据(labeled dat...

3324
来自专栏AI科技评论

干货 | 不能更通俗易懂的机器学习名词解释

train? valid? or test? 机器学习最明显的一个特点是需要大量的数据。特别对监督学习来说,就是需要大量的带标签数据(labeled dat...

3337
来自专栏AI研习社

CS224n 更新 | 第十一讲 - GRU 及 NMT 的其他议题

自然语言处理(NLP)是信息时代最重要的技术之一。理解复杂的语言话语也是人工智能的重要组成部分。 NLP 的应用无处不在,因为人与人之间大部分的沟通都需要语言:...

531
来自专栏量子位

与神经网络相比,你对P图一无所知

从一张照片里取出某个元素,再把它神不知鬼不觉地混入另一张图片里,似乎是一件很有难度的事情。毕竟,分分钟就会产生魔性的拼贴效果,不管是手动操作,还是AI的计算。

692
来自专栏大数据文摘

大咖 | 斯坦福教授骆利群:为何人脑比计算机慢1000万倍,却如此高效?

622

扫描关注云+社区