9月份最热门的机器学习开源项目TOP 5

作者|Pranav Dar

译者|郝毅

编辑|Debra

AI 前线导读:随着越来越多的专业人员争相投入到机器学习领域,每个人都需要让自己的专业知识保持与时俱进,需要了解最新的进展以及框架。Github 则是一个很好的途径,可以随时获取到最新的项目与研究进展。本文为大家推荐了九月份 github 上 Top5 的优秀项目,供大家参考与学习。本文首发于 Analytics Vidhya,由 AI 前线公众号整理编译。

更多干货内容请关注微信公众号“AI 前线”(ID:ai-front)

论文和代码

相信大家都曾为如何自己实现论文中的代码而苦恼过,在互联网上搜索相关的代码可以说是非常的令人煎熬。在这个 repo 中,包含了数以百计的机器学习和深度学习研究论文及其代码。该 repo 的范围非常惊人,可以说是数据科学家的宝库。该 repo 中的链接每周都会更新,值得一提的是 NIPS2018 的一些相关工作也已经被收藏进该 repo。

github 链接:https://github.com/zziz/pwc

使用深度学习进行目标检测

目标检测在深度学习领域普及的十分迅速,这是毋庸置疑的。包括从游戏到监控的大量现实应用支撑起了目标检测的主要研究对象。那么是否有一个一站式的商店能够提供自 2014 年以来的所有顶级目标检测算法?

恭喜你找对地方了!跟上一个 repo 类似,该 repo 中包含了目标检测领域的主要研究论文以及他们的代码实现。并且最棒的一点是,这些代码有多种框架实现的版本,所以不管你是 Tensorflow、Keras、PyTorch 亦或是 Caffe 的用户,都可以从中有所收获。

截止目前,该仓库中已经包含 43 个论文以及相关代码。

github 链接:(https://github.com/hoya012/deep_learning_object_detection)

用 18 分钟训练 ImageNet 模型

没错,现在你自己也可以在 18 分钟内完成模型在 ImageNet 数据库上的训练了!Jeremy Howard 和他的团队,根据流行的 DAWNBench 基准设计了性能超越 Google 的算法。该基准可以测量深度学习模型的训练时间、损耗以及其他方面的指标。

现在你可以在自己的机器上重现这一工作过程。该任务需要使用 Python3.6 或更高版本。

github 链接:[https://github.com/diux-dev/imagenet18]

Pypeline—创建并发数据管道

在大部分的机器学习项目中,数据工程是一个关键步骤。但如今,很多数据科学家都渐渐忽略了这一部分而更注重于更好的建模问题。然而,这并不是一个好的做法!一个好的数据科学家需要了解甚至熟悉数据工作流的工作方式,包括 Hadoop、Spark 和 Dask 等等。

听起来有些可怕吗?看一下这个 repo 吧,Pypeline 是一个简单却非常有效的 Python 库,用于创建和发送数据工作流。此 repo 的目的是解决中低级数据任务 (包括并发和并行),在这些任务中 Spark 也许并不非常适用。

此 repo 包括代码、基准测试、文档和其他资源,可帮助你成为数据管道专家!

github 链接:[https://github.com/cgarciae/pypeln]

人人都可以成为跳舞高手:姿态估计

表情模仿的相关算法相信大家早有耳闻,如今,AI 已经可以根据某段视频中人体的动作在另一个视频中让目标人物做出相同的动作了。该工作是人体姿态估计领域的最新成果,小编强烈推荐读者阅读 GitHub 原文查看动图,视觉效果非常震撼。

该 repo 中包含了此算法的 PyTorch 实现。此算法可以捕捉和复制的细节非常惊人,读者可以克隆之后测试一下。

英文原文:

https://www.analyticsvidhya.com/blog/2018/10/best-machine-learning-github-repositories-reddit-threads-september-2018/

如果你喜欢这篇文章,或希望看到更多类似优质报道,记得给我留言和点赞哦!

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181010B0OXCR00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券