专栏首页CDA数据分析师大家都收藏了的最新开源项目Top12!CV、NLP、机器学习一应俱全

大家都收藏了的最新开源项目Top12!CV、NLP、机器学习一应俱全

译者 | 林椿眄、Jane 责编 | Jane

出品 | AI科技大本营

本文经授权转自AI科技大本营

【导读】作者整理了近期最新发布及更新的 12 个非常有学习和收藏意义的开源项目。这些项目中包括基于 TensorFlow 的强化学习框架;可以对数据进行结构化处理的 AutoML 库;支持 TensorFlow,PyTorch,MXNet,CNTK 和 Caffe2 等多种深度学习框架的模型部署框架;可以帮助用户分析训练模型的工具;强大的人脸标记开源项目等等,可以说每一个项目都值得我们了解一下!接下来,我们就一起找到你喜欢的那一个,码起来!

1.Dopamine

基于 TensorFlow 的强化学习框架,Dopamine 是一个能够快速实现强化学习算法原型的研究框架,旨在为研究人员提供一个易于使用的实验室环境,并满足对小型、易于访问的代码库的需求。有了这个框架,你可以在研究过程中轻松地建立实验过程来验证你自己的想法。

GitHub 地址: https://github.com/google/dopamine

2.TransmogrifAI

TransmogrifAI 是一个用 Scala 编写的端到端的 AutoML 库,由 Salesforce 提供的开源项目。它能够在 Spark 运行,对数据进行结构化处理,旨在通过自动化机器学习技术,帮助开发者加速产品化过程。它仅需少量的代码,就能实现数据清理、特征工程和模型自动化过程,然后训练高性能的模型并将其应用于下一步的迭代和探索研究。

GitHub 地址: https://github.com/salesforce/TransmogrifAI

3.OpenNRE

OpenNRE 是基于 Tensorflow 开发的,一个用于神经网络关系提取的工具包,由清华大学刘知远老师及其团队贡献的开源项目。在该项目中,关系提取会分为嵌入、编码器、选择器和分类器四步。

Github 地址: https://github.com/thunlp/OpenNRE

4. TensorFlow Model Analysis

TFMA 是由 Google 发布的,一个 TensorFlow 模型分析的开源项目,旨在帮助 TensorFlow 用户分析训练好的模型。用户可以使用 Trainer 中定义的指标,以分布式的方式来评估大量数据的模型。此外,根据不同的数据计算指标,用户还可以将结果在 Juputer Notebooks 中进行可视化。

GitHub 地址: https://github.com/tensorflow/model-analysis

5. GraphPipe

graphPipe 是一个通用的深度学习模型部署框架,是由 Oracle 提供的开源项目。它旨在帮助用户简化机器学习模型的部署,并使用户摆脱特定框架的模型实现。此外,graphPine 还提供跨深度学习框架模型的通用API,开箱即用的部署解决方案和强大的性能。它支持 TensorFlow,PyTorch,MXNet,CNTK 和 Caffe2 等多种深度学习框架。

Github 地址: https://github.com/oracle/graphpipe

6. ONNX Model Zoo

这是一个通用的深度学习预训练模型集。该项目汇集了目前最好的深度学习预训练模型,这些模型全部由 Facebook 和 Microsoft 提供,以 ONNX (开放式神经网络交换) 的格式推出,并允许模型在不同框架之间进行迁移。每个模型都有一个相应的 Jupyter Notebook,其中包含模型训练,操作推理,数据集和参考等信息。

Github 地址: https://github.com/onnx/models

7 基于深度学习的人脸标定算法 (106 个人脸关键点)

这是一个强大的人脸标定的开源项目,包括面部美容,美容化妆,Crycocelle vivo 检测和人脸标定等预处理步骤。这个项目是基于传统的 SDM 算法,可在 Windows 平台上运行,并通过修改开源代码来简化部分测试代码及优化代码结构。基于深度学习技术,该项目设计了一种强鲁邦性的、并支持多面部追踪的高效网络模型。当前,深度学习算法在人脸标定领域取得了良好的效果,而该项目旨在提供一种相对简单易用的实现方法。

该项目主要有如下几大特点:

  • 我们使用 106 个人脸关键点,使得面部轮廓描述更加细腻。
  • 高准确率,即使在逆光和暗光条件下也可以获得良好的校准结果。
  • 模型小。追踪模型大约为2 MB,这非常易于在移动端实现模型集成。
  • 速度快。项目代码在 Qualcomm 820 (st) 上,单个人脸标定只需要7毫秒。
  • 增加多面部追踪功能。

Github 地址: https://github.com/zeusees/HyperLandmark

8. MagNet

MagNet 是一个基于 Pytorch 的深度学习高级 API,旨在位开发者减少模板的代码量,并优化深度学习项目开发的效率。

Github 地址: https://github.com/MagNet-DL/magnet

9. NLP.js

NLP.js 是一个基于 Node.js 的自然语言处理工具包。目前,它能够支持一系列的自然语言处理任务,包括单词分割,词干提取,句子分析,命名实体识别,文本分类和文本生成等任务。

Github 地址: https://github.com/axa-group/nlp.js

10. Texar

Texar 是一个基于 Tensorflow 的文本生成工具包,它能够支持诸如机器翻译,对话系统,文本总结和语言模型等任务,并允许研究者和开发者快速构建实验协议。

Github 地址: https://github.com/asyml/texar

▌11. Evolute

Evolute 是一个易于使用的进化算法框架。它定义了个体和种群等基础的结构,还能实现一些常见的进化算法操作,如选择,重现,突变和更新等。

Github 地址: https://github.com/csxeba/evolute

▌12. Task-Oriented Dialogue Dataset Survey

这是一种由任务驱动的对话数据收集项目,它能够将多种特定的、由任务驱动的对话系统数据汇集在一起,如 Dialogue bAbl, Stanford Dialog,Consonant data,DSTC-2,CamRest676 和 DSTC4 等系统。

Github 地址: https://github.com/AtmaHou/Task-Oriented-Dialogue-Dataset-Survey

原文链接: https://www.tutorialdocs.com/article/12-ai-open-source-projects.html

本文分享自微信公众号 - CDA数据分析师(cdacdacda)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-10-15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 知识体系、算法题、教程、面经,这是一份超赞的AI资源列表

    照例先放上 GitHub 地址:https://github.com/Awesome-Interview/Awesome-Interview#LeetCode,...

    CDA数据分析师
  • AI 开发者不容错过的 20 个机器学习和数据科学网站

    如今,科技界最热门的话题莫过于最先进、最前沿、最令人兴奋的数据科学和机器学习了。然而,要想紧跟该领域的进步和发展,你需要付出大量努力来研究、阅读和查看信息、新闻...

    CDA数据分析师
  • 新手如何发布第一个Python项目开源包?这里有一份详细指南

    作者以 SciTime 项目(一个对算法训练时间进行估计的包)的发布为例,详细解释了发布的每个步骤。

    CDA数据分析师
  • 大家都收藏了的最新开源项目Top12!CV、NLP、机器学习一应俱全

    【导读】作者整理了近期最新发布及更新的 12 个非常有学习和收藏意义的开源项目。这些项目中包括基于 TensorFlow 的强化学习框架;可以对数据进行结构化处...

    AI科技大本营
  • 大家都收藏了的最新开源项目Top12!CV、NLP、机器学习一应俱全

    【导读】作者整理了近期最新发布及更新的 12 个非常有学习和收藏意义的开源项目。这些项目中包括基于 TensorFlow 的强化学习框架;可以对数据进行结构化处...

    zenRRan
  • 浅谈Android开发者2017年最值得关注的25个实用库

    这是在2017年发布的25个最好的Android开发库的列表。所有这些都值得尝试 。 以下不是排名顺序。 让我们开始吧!

    砸漏
  • NLP简报(Issue#7)

    在机器学习的背景下,合成泛化(compositional generalization)是指机器学习从一组训练示例学习上下文表示。迄今为止,尚不清楚如何正确地测...

    kaiyuan
  • 8种优秀预训练模型大盘点,NLP应用so easy!

    NLP的快速增长主要得益于通过预训练模型实现转移学习的概念。在NLP中,转移学习本质上是指在一个数据集上训练模型,然后调整该模型以便在不同数据集上实现NLP的功...

    大数据文摘
  • Top 50机器学习项目实战总结

    整理 | 胡永波 根据《纽约时报》的说法,“在硅谷招募机器学习工程师、数据科学家的情形,越来越像NFL选拔职业运动员,没有苛刻的训练很难上场了。”毕竟,高达12...

    企鹅号小编
  • 几个作品

    3.拥有置于前台的服务,实现Notification的播放、暂停按钮与其他界面同步。

    爱因斯坦福

扫码关注云+社区

领取腾讯云代金券