【开源公告】腾讯第三代高性能计算平台Angel 正式全面开源

Angel 项目简介

Angel是一个基于参数服务器(Parameter Server)理念开发的高性能分布式机器学习框架,在其之上,用户能轻松开发适用于高维度模型的机器学习算法,并使用基于PS Service的Spark on Angel,轻松进行十亿级别维度模型的训练。未来Angel将进一步支持图计算和深度学习框架集成。

Angel由腾讯和北京大学联合开发,兼顾工业界的高可用性和学术界的创新性。欢迎对机器学习有兴趣的同仁一起贡献代码,提交Issues或者Pull Requests。

Release Notes (V1.0.0 )

1、ParameterServer功能

  • 基于Matrix/Vector的模型自动切分和管理,兼顾稀疏和稠密两种格式
  • 支持对Model进行Push和Pull操作,可以自定义复杂的psFunc
  • 提供多种同步控制机制(BSP/SSP/ASP)

2、开发运行

  • 语言支持:系统基于Scala和Java开发,用户也可以自由选择
  • 部署方便:可以直接在Yarn社区版本中运行,也支持本地调试模式
  • 数据切分: 自动切分读取训练数据,默认兼容了Hadoop FS接口
  • 增量训练:训练过程中会自动Checkpoint,而且支持加载模型后,增量训练

3、PS Service

  • 只启动PSServer和PSAngent,为其他分布式计算平台提供PS服务
  • 基于PS-Service,不需要修改Spark核心代码,直接开发Spark-on-Angel算法,该模式无缝支持Breeze数值运算库

4、算法库

  • 集成Logistic Regression,SVM,KMeans,LDA,MF,GBDT等机器学习算法
  • 多种优化方法,包括ADMM,OWLQN, LBFGS和GD
  • 支持多种损失函数、评估指标,包含L1、L2正则项

5、算法优化

  • LDA采用了F+LDA算法用于加速采样的速度,同时利用流式参数获取的方法减少网络参数获取的延迟
  • GBDT使用两阶段树分裂算法,将部分计算转移到PS,减少网络传输,提升速度

官方开源地址: https://github.com/Tencent/angel

喜欢它别忘了去github上给它一个star!

原文发布于微信公众号 - 腾讯开源(tencentopen)

原文发表时间:2017-06-19

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

开源 | 浏览器上最快的DNN执行框架WebDNN:从基本特性到性能测评

选自Github 机器之心编译 参与:蒋思源、晏奇 WebDNN 是网页浏览器中最快的 DNN 执行框架,而本文首先简单介绍了 WebDNN 特征与其框架结构...

32960
来自专栏人工智能

作为TensorFlow的底层语言,你会用C+构建深度神经网络吗?

选自Matrices.io 作者:Florian Courtial 机器之心编译 参与:李泽南、蒋思源 很多人都知道 TensorFlow 的核心是构建在 C+...

29480
来自专栏AI研习社

问答 | tensorflow 怎么配置非数据并行分布式?

假设模型有两个conv层和1个fc层,有3台服务器每台各一块显卡,请问要怎么实现把计算图拆成3部分,每块显卡分别计算一个层,而不是把计算图完整复制3份放到3块卡...

26230
来自专栏腾讯移动品质中心TMQ的专栏

【腾讯TMQ】看图测试指南:图像识别在测试中的应用

也许我们使用过Uiautomator或Monkey来进行系统的测试。但在使用过程中总出现用Uiautomator没法识别、用Monkey无法法复现等问题……本文...

73500
来自专栏编程

安卓手机如何玩转动作手势检测?有TensorFlow就够了,附实用教程

? 原文来源:Lemberg Solutions Ltd 作者:Zahra Mahoor、Jack Felag、 Josh Bongard 编译:嗯~阿童木呀...

44970
来自专栏新智元

【干货】神经增强:用 Python 实现深度学习超分辨率处理

【新智元导读】神经网络基于样本图像的训练为模糊图像补充细节,从而把模糊图像变高清。它不能把你的照片重建成一模一样的高清版。这只有好莱坞大片才有可能做到——但使用...

74950
来自专栏人工智能

Apache Spark 2.0预览:机器学习模型持久性

以上所有应用场景在模型持久性、保存和加载模型的能力方面都更为容易。随着Apache Spark 2.0即将发布,Spark的机器学习库MLlib将在DataFr...

48180
来自专栏新智元

【解放程序员】MIT“创世纪”机器学习新系统,自动生成补丁修复Bug

【新智元导读】当您辛辛苦苦写了大半年程序,终于要享受一下国庆长假的时候,别让 bug 把您的假期毁了。MIT 研究团队开发了一个称为“创世纪”的系统,能够对以前...

37750
来自专栏企鹅号快讯

重合散点图绘制:neat

hello诸君,暖阳高照,午间一杯清茶,又到了爬虫俱乐部向大家种草新命令新方法的时候啦! 许多同学学到的第一个Stata绘图命令想必就是scatter命令,该命...

29990
来自专栏WOLFRAM

Mathematica 11.1.1 中文版已发布

15230

扫码关注云+社区

领取腾讯云代金券