10月机器学习开源项目Top10

作者 | Mybridge

译者 | 林春眄

整理 | Jane

出品 | AI科技大本营

【导读】过去一个月里,我们对近 250 个机器学习开源项目进行了排名,并挑选出热度前 10 的项目。这份清单的平均 github star 数量高达 1345,涵盖了包括深度学习, Tensorflow, 图像分割, 漫画着色, 强化学习,Unity 等主题,希望你能从中找到一个你所感兴趣的项目深入探究。

Top 1 :fastai

fastai 库由 fast.ai 研究团队贡献,使用当前最佳的实践研究简化了快速准确的神经网络训练。你可以在 fastai 官网找到并使用它。fastai 库是基于 fast.ai 团队进行的深度学习最佳实践研究,包括对视觉,文本,表格和协作(协同过滤)模型的支持,方便研究者直接使用。你可以在示例文件夹中找到有关示例,也可以参阅完整的文档以便了解更详细的使用说明。

Github 地址:

https://github.com/fastai/fastai?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

官网:

https://docs.fast.ai/

Top 2:Deepvariant

Deepvariant 是由 Google 研究团队贡献的开源项目,通过运用深度神经网络来从下一代 DNA 序列数据中预测遗传变异。它是基于 Python/C++ 的程序,尚且只支持 Python 2.7,并能够在任何 unix 操作系统上运行。Deepvariant 具有高精度,强鲁棒性,快速高效,灵活性强,易于使用等优点。

Github 地址:

https://github.com/google/deepvariant?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

Top 3:Albumentations

Albumentations 是一个快速的图像增强库,它易于使用并封装了其他一些图像处理库的功能。此外,它还具有如下特点:

  • 基于高度优化的 opencv 的快速扩充
  • 具有超级简单但功能强大的使用界面,并广泛适用于不用的任务,如分割,检测等
  • 易于定制
  • 易于添加其他的框架,兼容性好

Github 地址:

https://github.com/albu/albumentations?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

Top 4:MangaCraft

MangaCraft 是当前最佳的半自动化漫画着色项目。

Github 地址:

https://github.com/lllyasviel/MangaCraft?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

参考视频:

https://www.bilibili.com/video/av32698923/

Top 5:Holodeck

Holodeck 是用于强化学习和机器人研究的模拟器,它具有高保真性。你可以访问该项目所提供的用户使用手册,以便更加详细的了解整个过程。

Github 地址:

https://github.com/byu-pccl/holodeck?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

使用手册

https://holodeck.readthedocs.io/en/latest/

Top 6:Petastorm

Petastorm 是 Uber ATG 研发的一个开源数据访问库。它可直接从 Apache Parquet格式的数据集中进行单机或分布式训练,以及深度学习模型的评估。此外,Petastorm 还支持当前流行的基于 Python 的机器学习(ML)框架,如 Tensorflow,PyTorch 和PySpark,也可以通过纯 Python 代码来使用它。

Github 地址:

https://github.com/uber/petastorm?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

Top 7:Ngx

Ngx 是一个基于神经网络的视觉生成器和混合器,能够利用神经网络进行 VJing 过程。它将 pix2pix (使用 cGAN 的图像到图像转换)作为 ad-hoc 的下一帧预测模型,使用从视频剪辑中提取的成对连续帧数据进行反复地训练,以便模型能够生成无限持续时间的图像序列。此外,它还能够混合(交叉淡化) 两个 pix2pix 模型,这些模型会产生变化,并转换为生成的视频。

Gituhub 地址:

https://github.com/keijiro/Ngx?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

Top 8:AlphaAI

AlphaAI 是一个使用无监督和监督学习进行股票预测的开源项目,通过堆叠神经网络的实现来预测股票的盈利值。它包含多个训练组件,使用者可以通过调整替换各种组件组成以便模型获得最佳的预测结果。

Gituhub 地址:

https://github.com/VivekPa/AlphaAI?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

Top 9:Blueoil

Blueoil 是一个将深度学习应用于小型设备的开源项目。它能够训练一个神经网络,并将训练好的模型转化为可执行的二进制库,以便通过 FPGA 进行加速。

Gituhub 地址:

https://github.com/blue-oil/blueoil?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

Top 10:Tencent-ml-images

Tencent-ml-images 是包含当前最大的多标签图像数据库(ml-images) 的开源项目,共由 11166 个图像类别,17609752 张训练图像和 88739 哥验证数据的URL 地址组成。此外,通过迁移学习,将ml-images 上预训练好的ResNet-101 模型迁移到 ImageNet 数据库上,能够实现 80.73% 的 Top1 精度。

Gituhub 地址:

https://github.com/Tencent/tencent-ml-images?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

--【完】--

原文发布于微信公众号 - AI科技大本营(rgznai100)

原文发表时间:2018-10-29

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏奇点大数据

你的“跳一跳”榜上有名了吗?聊聊“跳一跳”开挂方法

最近“跳一跳”在朋友圈风靡一时,吃饭的时候,人家跟你聊跳了多少步,你要没上200都不好意思跟人家打招呼。作为AI研发的机构,我们更关心怎么样才能自动让AI走的更...

3666
来自专栏算法channel

TensorFlow 入门进阶

TensorFlow is a software library for designing and deploying numerical computati...

1324
来自专栏AI科技大本营的专栏

机器学习不神秘!手把手教你用R语言打造文本分类器

简单安装几个R软件包,你就直接在自己电脑上打造出一个文本分类器,用进行机器来评估人类写作。 本文是一篇极简的上手教程,它想用清晰明了的步骤告诉读者,机器学习不...

37216
来自专栏量子位

自动机器学习工具全景图:精选22种框架,解放炼丹师

收集原始数据、合并数据源、清洗数据、特征工程、模型构建、超参数调优、模型验证和设备部署。

1574
来自专栏AI科技大本营的专栏

手动特征工程已经OUT了!自动特征工程才是改进机器学习的方式

【导读】近年来,我们在自动模型选择和超参数调优方面取得了进展,但机器学习流程中最重要的方面-- 特征工程,在很大程度上被我们所忽略。在本文中,我们将使用 Fea...

1783
来自专栏月色的自留地

从锅炉工到AI专家(2)

1964
来自专栏腾讯大数据的专栏

深度神经网络DNN的多GPU数据并行框架 及其在语音识别的应用

深度神经网络(Deep Neural Networks, 简称DNN)是近年来机器学习领域中的研究热点,产生了广泛的应用。DNN具有深层结构、数千万参数需要学...

2737
来自专栏机器之心

贾扬清撰文详解Caffe2:从强大的新能力到入门上手教程

选自 Nvidia Blog 作者:Aaron Markham、贾扬清 机器之心编译 昨天,Facebook 推出了 Caffe2,一个兼具表现力、速度和模块性...

3183
来自专栏顶级程序员

人工智能“鉴黄师”

最近,雅虎利用分类神经网络搭建了一套可以辨别Not Suitable for Work(上班不宜,以下简称NSFW)色情图片的Caffe模型,并将源码搬上了gi...

3099
来自专栏QQ大数据团队的专栏

神盾推荐系统的超大规模参数学习探究

前言 本文介绍我们在推荐系统领域的大规模参数学习研究. 问题的起源是探究给每一个用户学习一个 ID 层级的表征, 而在千万量级的业务上, 学习如此特征将会牵涉...

7.4K9

扫码关注云+社区

领取腾讯云代金券