2018年最出色30个机器学习项目

数据简化DataSimp导读:《2018年最出色的30个机器学习项目》是美国IT媒体Medium原标题30 Amazing Machine Learning Projects forthe Past Year (v.2018)汉译文,来自Mybridge介绍了2017年最惊艳的30个机器学习项目。这些ML项目有:第1名FastText,第2名Deep-photo-styletransfer,第3名face_recognition,第4名Magenta,第5名Sonnet,第6名deeplearn.js,第7名fast-style-transfer,第8名Pysc2,第9名AirSim,第10名Facets等。欢迎下载PDF资料,附数据简化DataSimp社区简介。

盘点:2018年最出色的30个机器学习项目

文|Mybridge,数据简化DataSimp2018-09-13

在过去的一年里,我们比较了近8800个开源的机器学习项目,并从中评选出了前30名(0.3%的机会入选)。这是一个极具竞争力的榜单,它仔细挑选了2017年1月到12月之间发布的最好的开源机器学习库、数据集和应用程序。Mybridge AI将项目的受欢迎程度、参与度和时效性等指标纳入评估标准来判断项目的质量。这些项目在Github上收藏量(获得的星数)的平均值是3558,这个数字足以让你对这些项目的质量有个大致了解。

开放源码项目对数据科学家很有用。而你也可以通过阅读源代码这一方式来学习,并在这些现有项目的基础上构建一些新的内容。给自己足够的时间去尝试一下这些去年你可能错过的激动人心的机器学习项目吧。

第1名:FastText

用于快速文本显示和分类的库,Github收藏量11786星。项目隶属于Facebook研究院。

第2名:Deep-photo-styletransfer

论文“深度照片风格转换”的代码和数据,Github收藏量9747星。项目隶属于Fujun Luan,康奈尔大学博士。

第3名:face_recognition

世界上最简单的用于Python和命令行的面部识别API,Github收藏量8672星。项目隶属于Adam Geitgey。

第4名:Magenta

利用机器智能进行音乐和艺术创作的项目,Github收藏量8113星。

第5名:Sonnet

基于Google TensorFlow 的神经网络库,Github收藏量5731星。项目隶属于来自Deepmind的Malcolm Reynolds。

第6名:deeplearn.js

用于网络的硬件加速机器智能库,Github收藏量5462星。项目隶属于来自Google Brain的Nikhil Thorat。

第7名:fast-style-transfer

基于TensorFlow的图片与视频风格转换工具,Github收藏量4843星。项目隶属于来自MIT的Logan Engstrom。

第8名:Pysc2

星际争霸2学习环境,Github收藏量3683星。项目隶属于来自Deepmind的Timo Ewalds。

第9名:AirSim

为微软AI研究部门的自动驾驶汽车提供的基于UnrealEngine的开源模拟器,Github收藏量3861星。项目隶属于来自微软的Shital Shah。

第10名:Facets

机器学习数据集的可视化项目,Github收藏量3371星。项目隶属于Google Brain。

第11名:Style2Paints

给图片上色的AI工具,Github收藏量3310星。

第12名:Tensor2Tensor

谷歌研究院一个通用序列到序列模型的库,Github收藏量3087星。项目隶属于来自Google Brain的Ryan Sepassi。

第13名:pytorch-CycleGAN-and-pix2pix

Pytorch中图像风格或者内容转换工具,如卫星地图转换为二维平面图、油画与照片风格转换等;Github收藏量2847星。项目隶属于来自伯克利大学的博士Jun-Yan Zhu。

第14名:Faiss

一个高效的相似搜索和密集向量聚类的库,Github收藏量2629星。隶属于Facebook研究院的项目。

第15名:Fashion-mnist

一个类似于mnist的时尚产品数据库,Github收藏量2780星。项目隶属于来自Zalando Tech的研究科学家Han Xiao。

第16名:ParlAI

在各种公开可用的对话数据集上训练和评估AI模型的框架,Github收藏量2578星。项目隶属于来自Facebook研究院的Alexander Miller。

第17名:Fairseq

Facebook AI研究序列到序列模型的工具包,Github收藏量2571星。

第18名:Pyro

用Python和PyTorch进行深度通用概率编程,Github收藏量2387星。项目隶属于Uber的AI实验室。

第19名:iGAN

由GAN驱动的动态图像生成,Github收藏量2369星。

第20名:Deep-image-prior

不借助机器学习而实现的神经网络图像恢复,Github收藏量2188星。项目隶属于俄罗斯Skolkovo科学技术大学博士Dmitry Ulyanov。

第21名:Face_classification

使用fer2013/imdb数据集与keras CNN模型和openCV进行的实时人脸检测和情感/性别分类,Github收藏量1967星。

第22名:Speech-to-Text-WaveNet

使用DeepMind的WaveNet和tensorflow技术进行精确到句子的端到端英语语音识别,Github收藏量1961星。项目隶属于Kakao Brain的Namju Kim。

第23名:StarGAN

多网络下图像到图像转换的统一生成框架,Github收藏量1954星。项目隶属于高丽大学的Yunjey Choi。

第24名:MI-angets

机器学习统一代理,Github收藏量1658星。项目隶属于Unity3D深度学习部门的Arthur Juliani。

第25名:DeepVideoAnalytics

一个分布式可视化搜索和可视化数据分析平台,Github收藏量1494星。项目隶属于康奈尔大学的博士Akshay Bhat。

第26名:OpenNMT

Torch环境下的开源神经网络机器翻译工具,Github收藏量1490星。

第27名:Pix2pixHD

利用受限的GANs合成和操作2048x1024图像的工具,Github收藏量1283星。项目隶属于Nvidia的AI研究院科学家Ming-Yu Liu。

第28名:Horovod

针对TensorFlow的分布式训练框架,Github收藏量1188星。项目隶属于Uber Engineering。

第29名:AI-Blocks

一个强大且直观的“所见即所得”人机界面,任何人都可以基于这一工具创建机器学习模型。Github收藏量899星。

第30名:deep-voice-conversion

TensorFlow中用于语音转换(语音风格转换)的深层神经网络,Github收藏量845星。项目隶属于来自Kakao Brain AI研究院的Dabi Ahn。

-END-

参考文献(470字)

1.Medium.30 AmazingMachine Learning Projects for the Past Year (v.2018).[EB/OL]Mybridge,https://Mybridge.Medium.org/a/30Amazing Machine Learning Projects for the Past Year (v.2018),2018-04-00.

2.Mybridge.盘点:2018年最出色的30个机器学习项目.[EB/OL]36氪,http://www.sohu.com/a/252229840_114778,2018-09-06.

我桥2018年最出色的30个机器学习项目(3105字)

秦陇纪

简介:我桥2018年最出色的30个机器学习项目。(公号回复“机器学习2018”,文末“阅读原文”可下载31图5k字12页PDF报告)蓝色链接“数据简化DataSimp”关注后下方菜单项有文章分类页,欢迎转发、赞赏支持社区。作者:我桥MyBridge。来源:MyBridge网站、数据简化社区秦陇纪微信群聊公众号,引文出处请看参考文献。主编译者:秦陇纪,数据简化社区、科学Sciences、知识简化新媒体创立者,数据简化OS架构师、C/Java/Python/Prolog程序员,IT教师。每天大量中英文阅读/设计开发调试/文章汇译编简化,时间精力人力有限,欢迎转发/赞赏/加入支持社区。版权声明:科普文章仅供学习研究,公开资料©版权归原作者,请勿用于商业非法目的。秦陇纪2018数据简化DataSimp综合汇译编,投稿合作,或出处有误、侵权、错误或疏漏(包括原文错误)等,请联系DataSimp@126.com沟通、指正、授权、删除等。欢迎转发:“数据简化DataSimp、科学Sciences、知识简化”新媒体聚集专业领域一线研究员;研究技术时也传播知识、专业视角解释和普及科学现象和原理,展现自然社会生活之科学面。秦陇纪发起未覆盖各领域,期待您参与~~强烈谴责超市银行、学校医院、政府公司肆意收集、滥用、倒卖公民姓名、身份证号手机号、单位家庭住址、生物信息等隐私数据!

目录

我桥2018年最出色的30个机器学习项目(3105字)

A我桥2018年最出色的30个机器学习项目(2641字)

参考文献(470字)Appx(845字).数据简化DataSimp社区简介

Appx(845字).数据简化DataSimp社区简介

信息社会之数据、信息、知识、理论持续累积,远超个人认知学习的时间、精力和能力。应对大数据时代的数据爆炸、信息爆炸、知识爆炸,解决之道重在数据简化(Data Simplification):简化减少知识、媒体、社交数据,使信息、数据、知识越来越简单,符合人与设备的负荷。数据简化2018年会议(DS2018)聚焦数据简化技术(Data Simplification techniques):对各类数据从采集、处理、存储、阅读、分析、逻辑、形式等方ose做简化,应用于信息及数据系统、知识工程、各类Python Web框架、物理空间表征、生物医学数据,数学统计、自然语言处理、机器学习技术、人工智能等领域。欢迎投稿数据科学技术、简化实例相关论文提交电子版(最好有PDF格式)。填写申请表加入数据简化DataSimp社区成员,应至少一篇数据智能、编程开发IT文章:①高质量原创或翻译美欧数据科技论文;②社区网站义工或完善S圈型黑白静态和三彩色动态社区LOGO图标论文投稿、加入数据简化社区,详情访问www.datasimp.org社区网站,网站维护请投会员邮箱DataSimp@163.com。请关注公众号“数据简化DataSimp”留言,或加微信QinlongGEcai(备注:姓名/单位-职务/学校-专业/手机号),免费加入投稿群”科学Sciences学术文献”读者微信群等。长按下图“识别图中二维码”关注三个公众号(搜名称也行,关注后底部菜单有文章分类页链接):

数据技术公众号“数据简化DataSimp”:

社会教育知识公众号“知识简化”:

普及科学知识,分享到朋友圈

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180913G12UBD00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券