7月机器学习最佳开源项目Top 10

【导读】七月就要结束了,在即将到来的 7 月最后一个周末,人工智能头条为大家整理了本月 ML 最受欢迎的十大开源项目。就算放假在家也可以知道大家现在都在学些什么,学习放假两不误。这个周末我们一起过~~

机器学习开源项目 Top 10

我们从过去一个月将近250个机器学习开源项目中筛选出最受关注的10大开源项目,GitHub 上 Stars 平均为1041。其中涵盖了DensePose,图像分类,多尺度训练,移动端的AI 计算引擎,卫星图像,NLP,Python包,文字检测,NCRF,DALI 等主题。下面我们来一一介绍。

▌Top 1. DensePose

DensePose 是Facebook 研究院开发的一种实时人体姿态估计方法,它能够将2D RGB 图像中的目标像素映射到3D 表面模型。DensePose 项目旨在通过这种基于3D 表面模型来理解图像中的人体姿态,并能够有效地计算2D RGB 图像和人体3D 表面模型之间的密集对应关系。与人体姿势估计需要使用10或20个人体关节(手腕,肘部等) 不同的是,DenPose 使用超过5000个节点来定义,由此产生的估计准确性和系统速度将加速AR和VR 工作的连接。

相关链接: https://research.fb.com/facebook-open-sources-densepose/ Github 链接: https://github.com/facebookresearch/DensePose

▌Top 2. Darts

Darts 是 CMU 联合DeepMind 团队研发的一种可微分的卷积循环网络结构,它能够基于结构表征的连续性,通过梯度下降法来更有效地进行结构搜索。在CIFAR-10,ImageNet,Penn Treebank 和WikiText-2 等大型数据库的实验验证了这种结构在卷积图像分类和循环语言建模方面的高效性能。

论文链接: https://arxiv.org/pdf/1806.09055.pdf Github 链接: https://github.com/quark0/darts

▌Top 3. SNIPER

SNIPER 是一种高效的多尺度训练方法,可用于诸如目标检测,实例分割等图像识别任务。与图像金字塔处理图像中每个像素不同,SNIPER 是选择性地处理真实目标周围区域的像素。得益于其能在低分辨率的芯片上运行,这能够显着加速了多尺度训练进程。此外,高效的内存设计使得 SNIPER 在训练期间能够最大程度地受益于批量正则化方法 (BN),还能在单个 GPU 上实现更大批量的图像识别任务。因此,SNIPER 不需要跨 GPU 同步批量地处理统计数据,你可以像处理图像分类一样地训练你的目标检测器,简单而高效!

论文链接: https://arxiv.org/pdf/1805.09300.pdf Github 链接: https://github.com/mahyarnajibi/SNIPER

▌Top 4. Mace

Mace 是一个用于移动端的、异构计算平台的深度学习推理框架。在运行期间,它通过结合NEON,OpenCL 和Hexagon 进行优化,并引入Winograd 算法来加速卷积计算,因此初始化过程也将更快地优化。此外,它能很好地支持图级内存分配优化和缓冲器重用过程,试图保持最小的外部依赖性以减少内存占用空间。它还能良好地覆盖高通(Qualcomm),联发科技(Media Tek),Pinecone 和其他基于ARM 的芯片,以CPU 运行时还能与大多数的POSIX 系统和性能有限的体系结构兼容。

Github 链接: https://github.com/XiaoMi/mace

▌Top 5. Robosat

Robosat 是一种端到端的特征提取方法,能够用于航空和卫星图像的目标特征提取,包括图像中的建筑物,停车场,道路,汽车等目标。该方法主要包括三部分内容:

  • 数据准备:为训练特征提取模型创建一个数据集。
  • 训练和建模:为图像特征提取训练一个分割模型。
  • 后处理:将图像分割结果转为干净而简单的几何形状。

Github 链接: https://github.com/mapbox/robosat

▌Top 6. DecaNLP

DecaNLP 是由Saleforce 提出的一个自然语言界的“十项全能”挑战,其涵盖了十项自然语言任务:问答,机器翻译,摘要,自然语言推理,情感分析,语义角色标记,零目标关系提取,目标导向对话,语义分析和常识代词解析等任务。每种任务都被视为是一种问答问题,可以通过我们提出的多任务问答模型框架(Multitask Question Answering Network) 来解决。该模型能够联合学习DecaNLP 挑战中的所有任务,而不需要在多任务设置下设定某个特定任务的模块或超参数。

论文链接: https://arxiv.org/abs/1806.08730 Github 链接: https://github.com/salesforce/decaNLP

Top 7. Magnitude

Magnitude 是一种快速高效的通用向量嵌入式实用程序包,含有功能丰富的Python 包和矢量存储文件格式,可用于在Plasticity 中以快速、高效而简单的方式将矢量嵌入用于机器学习模型。它主要是为Gensim 提供一种更简单快速的替代方案,但也可以作为一种通用的矢量存储方法应用于NLP 以外的领域。

Github 链接: https://github.com/plasticityai/magnitude

▌Top 8. Porcupine

Porcupine 是一种自助式的、高精度、轻量级文字检测引擎,它能够使开发人员构建语音应用程序平台。它具有以下几大优势:

  • 自助式服务:你可以在几秒内选择任何的唤醒词(wake word) 并构建模型。
  • 能够使用真实情况下训练的深度神经网络(即噪声和混响)。
  • 结构紧凑且计算效率高,能够适用于物联网应用。
  • 跨平台应用:以纯定点ANSIC 实现,目前可支持Raspberry Pi,Android,iOS,watchOS,Linux,Mac 和Windows 等平台。
  • 可扩展性强:它可以同时检测数十个唤醒词(wake word),而几乎不需要额外的CPU /内存占用。

Github 链接: https://github.com/Picovoice/Porcupine

▌Top 9. NCRF

NCRF 是一种神经条件随机场结构,能够将检测到的癌症转移到WSI 中。这种框架通过完全连接的条件随机场(CRF),将相邻补丁之间的空间相关性直接并入CNN 结构的顶层特征提取器,并采用标准的端到端训练方式,以反向传播法进行优化。实验结果表明这种框架能够获得更佳质量的预测概率图,并取得不错的平均FROC 分数。

论文链接: https://openreview.net/pdf?id=S1aY66iiM Github 链接: https://github.com/baidu-research/NCRF

▌Top 10. DALI

DALI 是NVIDA 提出的一个数据加载库,它是一个高度优化的构建模块和执行引擎集合,可用于加速深度学习应用程序中输入数据的预处理过程。此外,DALI 还提供了不同数据的加速提供了足够的性能和灵活性,并可以轻松集成到不同的深度学习训练和推理程序中。它具有以下几大优势:

  • 能够直接从磁盘加速读取全数据,并为训练和推理过程做准备。
  • 通过可配置的图形和自定义操作实现足够的灵活性。
  • 支持图像分类和分段工作负载。
  • 直接通过框架插件和开源绑定轻松实现集成。
  • 具有多种输入格式的便携式训练工作流程,包括JPEG,LMDB,RecordIO,TFRecord 等格式。

Github 链接: https://github.com/NVIDIA/dali

原文发布于微信公众号 - IT派(transfer_3255716726)

原文发表时间:2018-07-29

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏量子位

Facebook开源移动端深度学习加速框架,比TensorFlow Lite快一倍

Facebook发布了一个开源框架,叫QNNPACK,是手机端神经网络计算的加速包。

16920
来自专栏AI研习社

野外动物监测图像挑战赛:预测捕捉到的野外图像是否包含动物

野外相机能够自动收集大量的图像信息,不过不幸的是,收集到的大量图片都是误报,这些错误大多是由非动物引起的,比如草木的晃动。 本次比赛旨在预测白天和晚上从各个地点...

36390
来自专栏机器之心

学界 | 香港浸会大学:四大分布式深度学习框架在GPU上的性能评测

选自arXiv 作者:施少怀、褚晓文 机器之心编译 参与:陈韵竹、李泽南 随着深度学习应用不断进入商用化,各类框架在服务器端上的部署正在增多,可扩展性正逐渐成为...

36770
来自专栏机器之心

深度 | 详解首个系统性测试现实深度学习系统的白箱框架DeepXplore

选自The Foretellix Blog 作者:Yoav Hollander 机器之心编译 参与:吴攀、晏奇 五月份,来自哥伦比亚大学和理海大学的几位研究者...

389100
来自专栏旭的专栏

机器学习之离散特征自动化扩展与组合

机器学习中特征工程处于十分重要的位置,整个学习中至少会花二分之一甚至更多的时间用于特征工程至少(对于统计学习)。但是如何能够有效地实现特征的自动化扩展、组合和量...

1.3K10
来自专栏机器学习之旅

应用:交叉销售算法

最近做了一个交叉销售的项目,梳理了一些关键点,分享如下,希望对大家有所启发 核心目标:在有限资源下,尽可能的提供高转化率的用户群,辅助业务增长 初步效果:商...

7410
来自专栏新智元

【超级干货】177页鲁棒机器学习教程(附PPT全文下载)

这个短期课程讨论了从有监督的机器学习中获得可靠决策的问题。它试图总结关于我们如何创建机器学习分类器的当前知识,这些分类器在进行预测时可以保证预测的正确性和高概率...

15830
来自专栏ATYUN订阅号

谷歌开源基于TensorFlow的通用框架AdaNet,快速且易于使用

Ensemble learning结合不同机器学习模型预测,被广泛用于神经网络以实现最先进的性能,得益于丰富的历史和理论保证,成功的挑战,如Netflix奖和各...

8620
来自专栏AI科技评论

动态|谷歌开源T2T模型库,深度学习系统进入模块化时代!

AI 科技评论按:6月19日,谷歌发布了T2T(Tensor2Tensor)深度学习开源系统,这个系统的一大优点是模块化,这也就意味着系统更加灵活,适应性更强。...

33480
来自专栏AI科技大本营的专栏

AI 技术讲座精选:用Keras和Gym实现深度强化学习

综述 ? 本篇博文将向大家演示,如何在仅仅运用78行代码的情况下,利用 Keras 和 Gym 实现深度强化学习,使得 CartPole 这款游戏得以成功运行...

311120

扫码关注云+社区

领取腾讯云代金券