2018年7月机器学习开源项目TOP 10

编译:chux

出品:ATYUN订阅号

在过去的一个月里,Mybridge AI根据各种因素对项目进行排名,在将近250个机器学习开源项目中选出前10位。

这个月10个项目在Github上平均评星为1041。

主题包括:DensePose,图像分类,多尺度训练,移动AI计算引擎,卫星图像,NLP,Python包,字检测,NCRF,DALI。

开源项目对程序员很实用,希望你找到一个启发你的有趣项目。

No.1:DensePose

这是一种实时方法,用于将2D RGB图像的所有人类像素映射到身体的3D表面模型。

DensePose-RCNN在Detectron框架中实现,由Caffe2提供支持。

Github 2901颗星。由Facebook Research提供。

项目:github.com/facebookresearch/DensePose?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

No.2:Darts

可分辨的架构搜索卷积和循环网络。该算法基于架构空间中的连续松弛和梯度下降。它能够有效地设计用于图像分类的高性能卷积体系结构(在CIFAR-10和ImageNet上)和用于语言建模的循环体系结构(在Penn Treebank和WikiText-2上)。只需要一个GPU。

Github 1128颗星。由Hanxiao Liu提供。

项目:github.com/quark0/darts?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

No.3:SNIPER,高效的多规模训练

SNIPER是一种有效的多尺度物体检测算法,用于实例级识别任务,如对象检测和实例级分割。SNIPER不是处理图像金字塔中的所有像素,而是选择性地处理地面实况对象(也称为芯片)周围的上下文区域。由于它在低分辨率芯片上运行,因此显着加速了多规模培训。由于其内存高效设计,SNIPER可以在训练期间受益于批量标准化,并且可以在单个GPU上实现更大批量大小的实例级识别任务。因此,我们不需要跨GPU同步批量标准化统计数据,我们可以训练对象检测器,类似于我们进行图像分类的方式!

Github 1352颗星。由Mahyar Najibi提供。

项目:github.com/mahyarnajibi/SNIPER?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

No.4:Mace

针对移动异构计算平台优化的深度学习推理框架。该设计侧重于以下目标:

  • 性能 使用NEON,OpenCL和Hexagon优化运行时,并 引入Winograd算法以加速卷积运算。初始化也被优化为更快。
  • 能量消耗 与芯片相关的电源选项如big.LITTLE调度,Adreno GPU提示作为高级API包含在内。
  • 响应 在运行模型时,UI响应性保证有时是强制性的。引入了将OpenCL内核自动分解为小单元的机制,以便更好地抢占UI呈现任务。
  • 内存使用和库占用空间 支持图级存储器分配优化和缓冲器重用。核心库试图保持最小的外部依赖性以保持库占用空间小。
  • 模型保护 自设计开始以来,模型保护一直是最优先考虑的事项。引入了各种技术,例如将模型转换为C ++代码和文字混淆。
  • 平台覆盖 良好的覆盖最近的高通,联发科技,Pinecone和其他基于ARM的芯片。CPU运行时还与大多数POSIX系统和性能有限的体系结构兼容。

Github 2118颗星。由小米提供。

项目:github.com/XiaoMi/mace?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

No.5:Robosat

航空和卫星图像的语义分割。提取功能,如:建筑物,停车场,道路,水。RoboSat附带的工具可分为以下几类:

数据准备:为训练特征提取模型创建数据集

训练和建模:图像特征提取的分割模型

后处理:将分割结果转换为干净和简单的几何形状

Github 776颗星。由Mapbox提供。

项目:github.com/mapbox/robosat?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

No.6:DecaNLP

自然语言十项全能是一项多任务挑战,涵盖十项任务:问答,机器翻译,摘要,自然语言推理,情感分析,语义角色标记,零镜头关系提取,目标导向对话,语义分析和常识代词解析。每个任务都被转换为问题回答,这使得我们可以使用新的多任务问题应答网络(MQAN)。此模型联合学习decaNLP中的所有任务,而多任务设置中没有任何特定于任务的模块或参数。

Github 886颗星。由Salesforce提供

项目:github.com/salesforce/decaNLP?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

No.7:Magnitude

Magnitude是一个快速,简单的矢量嵌入实用程序库,用于在Plasticity开发的快速,高效和简单的方式中将矢量嵌入用于机器学习模型。它主要是为Gensim提供更简单/更快速的替代方案,但可以用作NLP之外的域的通用密钥向量存储。

Github 427颗星。

项目:github.com/plasticityai/magnitude?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

No.8:Porcupine

由深度学习驱动的设备唤醒字检测引擎。

  • 自助服务。开发人员有权在几秒钟内选择任何唤醒词并构建其模型。
  • 使用在真实情况下训练的深度神经网络(即噪声和混响)。
  • 紧凑且计算效率高,使其适用于物联网应用。
  • 跨平台。它以纯定点ANSI C实现。目前支持Raspberry Pi,Android,iOS,watchOS,Linux, Mac和Windows。
  • 可扩展性。它可以同时检测数十个唤醒字,几乎没有额外的CPU /内存占用。
  • 开源。您在此存储库中找到的任何内容都是Apache 2.0许可的。

Github 373颗星。由Picovoice提供。

项目:github.com/Picovoice/Porcupine?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

No.9:NCRF

用神经条件随机场(NCRF)检测癌症转移。

Github 290颗星。由百度深度学习研究院提供。

项目:github.com/baidu-research/NCRF?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

No.10:DALI

DALI是高度优化的构建块和执行引擎的集合,用于加速深度学习应用程序的输入数据预处理。DALI提供加速不同数据流水线的性能和灵活性,作为单个库,可以轻松集成到不同的深度学习培训和推理应用程序中。

Github 420颗星。由NVIDIA提供。

项目:github.com/NVIDIA/dali?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

原文发布于微信公众号 - ATYUN订阅号(atyun_com)

原文发表时间:2018-07-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

资源 | 一个基于PyTorch的目标检测工具箱,商汤联合港中文开源mmdetection

项目地址:https://github.com/open-mmlab/mmdetection

7602
来自专栏机器之心

教程 | 如何使用TensorFlow实现音频分类任务

8437
来自专栏数说工作室

文本相似比较

大家好,我是数说君,这篇文章是想跟大家讨教一下。 如果有两段简单文本,如何比较它们的相似度?这里我们就假设是英文,不存在中文的分词问题,文本就类似于: text...

38014
来自专栏IT派

从Brain.js到Mind,一文收录11个移动端Javascript机器学习库

当我第一次和我们的 NLP 主要研究人员谈起这个概念时,她的原话是这样的。可能她是对的,但它也是一个非常有趣的概念,最近在 Javascript 领域得到了越来...

1210
来自专栏数据派THU

怎样构建中文文本标注工具?(附工具、代码、论文等资源)

来源:Paperweekly 本文长度为2218字,建议阅读4分钟 本文为你介绍中文文本标注工具的构建方法,并提供多个开源文本标注工具。 项目地址: https...

1.3K7
来自专栏机器之心

资源 | 基于神经网络的命名实体识别 NeuroNER

选自Neuroner 机器之心编译 参与:李亚洲 本文主要介绍了一种基于神经网络的命名实体识别系统 NeuroNER,并附上了安装、下载的项目地址,希望对自然语...

3289
来自专栏CVer

开源 | 商汤联合港中文开源 mmdetection

项目地址:https://github.com/open-mmlab/mmdetection

3423
来自专栏机器之心

业界 | 详解Horovod:Uber开源的TensorFlow分布式深度学习框架

选自Uber 作者:Alex Sergeev、Mike Del Balso 机器之心编译 参与:李泽南、路雪 Horovod 是 Uber 开源的又一个深度学...

8656
来自专栏PPV课数据科学社区

【学习】R语言中的情感分析与机器学习

#玩转大数据#利用机器学习可以很方便的做情感分析。本篇文章将介绍在R语言中如何利用机器学习方法来做情感分析。在R语言中,由Timothy P.Jurka开发的情...

3758
来自专栏专知

【AlphaGo Zero 核心技术-深度强化学习教程代码实战03】编写通用的格子世界环境类

【导读】Google DeepMind在Nature上发表最新论文,介绍了迄今最强最新的版本AlphaGo Zero,不使用人类先验知识,使用纯强化学习,将价值...

3074

扫码关注云+社区

领取腾讯云代金券