作者:PRANAV DAR
翻译:蒋雨畅
校对:丁楠雅
本文约2400字,建议阅读10分钟。
本文总结今年7月以来Github和Reddit上涉及AI、ML的重要内容。
介绍
你有没有想过不懂画画甚至不知道如何拿画笔也能成为一名艺术家?借助计算机视觉技术,您现在可以做到这一点。更妙的是,机器学习社区非常棒,以至于执行此操作的代码已经开源了!这就是GitHub的强大功能,以及为什么我鼓励所有有抱负或成熟的数据科学家定期使用它。
GitHub一直是开源数据科学和机器学习的核心。无论您是为现有存储库做贡献还是构建自己的存储库,您都可以获得大量的知识。
下面有一些非常酷的存储库 - 深度学习,GAN特定,自然语言处理(NLP)相关的文本匹配,以及用于扩展和重新构想现有图像的计算机视觉(如上所述)。这里有适合每个人的东西!
来到Reddit,我们选择了深度学习和人工智能相关的讨论。这些将帮助您评估和了解行业中某些技术的现状以及将来的方向。
您可以查看以下前6个月的顶级GitHub存储库和热门Reddit讨论(从4月开始):
一月:
https://www.analyticsvidhya.com/blog/2018/02/top-5-github-repositories-january-2018/
二月:
https://www.analyticsvidhya.com/blog/2018/03/top-5-github-repositories-february-2018/
三月:
https://www.analyticsvidhya.com/blog/2018/04/top-7-github-repositories-march-2018/
四月:
https://www.analyticsvidhya.com/blog/2018/05/top-5-github-reddit-data-science-machine-learning-april-2018/
五月:
https://www.analyticsvidhya.com/blog/2018/06/top-5-github-reddit-data-science-machine-learning-may-2018/
六月:
https://www.analyticsvidhya.com/blog/2018/07/top-github-reddit-data-science-machine-learning-june-2018/
GitHub存储库
图像修复
Github地址:
https://github.com/bendangnuksung/Image-OutPainting
这是本系列中最酷的存储库之一。“修复”最近一直是一个趋势概念,但这项由斯坦福大学的几位研究人员设计的技术,却运用了相反的概念。“Outpainting” 这个概念扩展了GAN用于修复的用途,来估计和想象现有图像在超出可见范围后,可能看起来的模样。然后运用算法将图像扩展到现有边界之外。正如您在上图所示,结果非常出色。
此存储库使用Python中的Keras的开源实现。您可以从头开始构建模型,也可以使用此存储库作者提供的模型。无论哪种方式,试试吧!
关于这个方法的详细文章:
Become a Computer Vision Artist with Stanford’s Game Changing ‘Outpainting’ Algorithm (with GitHub link):
https://www.analyticsvidhya.com/blog/2018/07/become-computer-vision-artist-stanfords-outpainting-algorithm-github-keras/
使用TensorFlow的文本分类模型
Github地址:
https://github.com/dongjun-Lee/text-classification-models-tf
这个存储库实现了它所说的 - 各种文本分类模型的TensorFlow实现。我喜欢这个存储库的是它包含已经讨论过的每个模型的链接。这样可以了解您正在做的事情,这非常有用。这里实现的模型是:
字级CNN
字符级CNN
非常深的CNN
字级双向RNN
基于注意的双向RNN
R-CNN
MatchZoo
Github地址:
https://github.com/faneshion/MatchZoo
虽然不是严格意义的上个月创建的库,但最近这个存储库得到了一个重大更新。MatchZoo基本上是一个文本匹配工具包。它的创建是为了设计,比较和分享各种深层文本匹配模型。MatchZoo可以做的潜在任务包括文档检索,会话响应排名,问题回答和释义识别等。
一些深度匹配方法有DRMM,MatchPyramid,MV-LSTM,aNMM,DUET等。你可以查看存储库以获取有关如何安装和利用这个库的详细信息。
GANimation
Github地址:
https://github.com/faneshion/MatchZoo
以上的面孔集合让你对这个存储库感到兴奋吗?绿色边框内是原始图像,其余图像使用GANimation在解剖学上改变主体的面部表情。这是一种稍微复杂的方法,但如果您对深度学习感兴趣,则可以进行探索。
作者提供了入门所需的一切 - 初学者指南,先决条件,数据准备资源,当然还有Python代码。你在等什么?快进来!
GAN稳定性
Github地址:
https://github.com/LMescheder/GAN_stability
这个Python项目是这篇上个月在2018年国际机器学习会议上提出的论文的部分实验代码:
Which Training Methods for GANs do actually Converge?
https://avg.is.tuebingen.mpg.de/publications/meschedericml2018
对于任何对深度学习尤其是GAN感兴趣的人来说,这是一个引人入胜的案例研究。
这个存储库入选的原因是它能让您对在顶级机器学习会议中接受和呈现的论文中的研究和思考水平有了一个很好的了解。您还可以在下面链接中查看ICML 2018中的最佳论文:
The Best Research Papers from ICML 2018 – A Must-Read for Data Scientists
https://www.analyticsvidhya.com/blog/2018/06/best-research-papers-icml-2018/
Reddit讨论
Source: Wikipedia
我应该实施哪些深度学习论文?
领取专属 10元无门槛券
私享最新 技术干货