2018年2月份Github上最热门的数据科学和机器学习项目

作者 | Pranav Dar

译者 | 马卓奇

编辑 | Emily

AI 前线导读:GitHub 项目仓库让数据科学领域的从业者可以方便快捷地跟进该领域的最新进展。它也是一个很好的协作工具,可以与其他数据科学家共同合作完成项目。本文将简单介绍 2 月份 Github 上最火的 5 个数据科学和机器学习项目。

更多干货内容请关注微信公众号“AI 前线”,(ID:ai-front)

FastPhotoStyle(快速照片风格转换)

FastPhotoStyle 是 NVIDIA 开发的 python 库。该模型将一张内容照片和一张风格图作为输入,然后将内容照片转换为风格图的风格。

开发人员给出了两个算法示例。第一个是十分简单的迭代算法——下载一张内容图和风格图,调整图像尺寸,然后运行照片真实感图像风格化代码。第二个样例中,需要利用语义分割标签图来生成带有语义的风格化图像。

Twitter Scraper(Twitter 爬虫)

如果你曾经在 Twitter 上爬过推送,你肯定用过 Twitter 自己给出的 API,Twitter 自己的 API 有流速限制。这个 python 库就是考虑到这一点——它没有 API 限流(不需要任何验证),没有限制,并且超级快。你可以用这个库爬取任何用户的任意一条推特。

开发者提出它可以用于设计马尔科夫链,但目前只能用于 python 3.6 及以上版本。

Handwriting Synthesis(手写体合成)

这个项目来自 Alex Graves 的论文《Generating Sequences with Recurrent Neural Networks(用 RNN 生成序列)》,是其中手写体合成实验的实现。它可以生成不同风格的手写字迹。模型包括初始化和偏置两个部分。初始化控制样例的风格,偏置控制样例的整洁度。

作者在这个项目的 GitHub 主页上展示了各种各样的样例风格。作者还在寻找这个项目的贡献者,如果你有兴趣,请与作者联系。

ENAS PyTorch(高效神经网络结构搜索)

这个项目是对论文《Efficient Neural Architecture Search (ENAS) via Parameters Sharing(参数共享的高效神经网络结构搜索)》的实现。ENAS 减少了计算需求,将 NAS 的 GPU 计算时间减少了足足 1000 倍。他们通过共享大型计算图中的子图模型间的参数实现了这一点。

使用方法在 GitHub 上有详细介绍,下面是这个库所需的依赖项:

Python 3.6+

PyTorch

tqdm, imageio, graphviz, tqdm, tensorboardX

Sign Language(手势语言识别)

这是一个相对简单又十分有趣的机器学习项目。开发人员在 python 中使用卷积神经网络构造模型,可以识别出手势,并将其转换成文字。

作者用 Tensorflow 和 Keras 共同搭建了 CNN 模型。作者特别详细地说明了他是怎么创建这个项目的,以及每一步是怎么进行的。所以这绝对是一个值得一试的项目。

查看英文原文:

https://www.analyticsvidhya.com/blog/2018/03/top-5-github-repositories-february-2018/

如果您觉得内容优质,记得给我们「留言」和「点赞」,给编辑鼓励一下!

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180323G086OJ00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券