前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【开源公告】腾讯第三代高性能计算平台Angel 正式全面开源

【开源公告】腾讯第三代高性能计算平台Angel 正式全面开源

作者头像
腾讯开源
发布2018-03-02 16:39:39
9670
发布2018-03-02 16:39:39
举报

Angel 项目简介

Angel是一个基于参数服务器(Parameter Server)理念开发的高性能分布式机器学习框架,在其之上,用户能轻松开发适用于高维度模型的机器学习算法,并使用基于PS Service的Spark on Angel,轻松进行十亿级别维度模型的训练。未来Angel将进一步支持图计算和深度学习框架集成。

Angel由腾讯和北京大学联合开发,兼顾工业界的高可用性和学术界的创新性。欢迎对机器学习有兴趣的同仁一起贡献代码,提交Issues或者Pull Requests。

Release Notes (V1.0.0 )

1、ParameterServer功能

  • 基于Matrix/Vector的模型自动切分和管理,兼顾稀疏和稠密两种格式
  • 支持对Model进行Push和Pull操作,可以自定义复杂的psFunc
  • 提供多种同步控制机制(BSP/SSP/ASP)

2、开发运行

  • 语言支持:系统基于Scala和Java开发,用户也可以自由选择
  • 部署方便:可以直接在Yarn社区版本中运行,也支持本地调试模式
  • 数据切分: 自动切分读取训练数据,默认兼容了Hadoop FS接口
  • 增量训练:训练过程中会自动Checkpoint,而且支持加载模型后,增量训练

3、PS Service

  • 只启动PSServer和PSAngent,为其他分布式计算平台提供PS服务
  • 基于PS-Service,不需要修改Spark核心代码,直接开发Spark-on-Angel算法,该模式无缝支持Breeze数值运算库

4、算法库

  • 集成Logistic Regression,SVM,KMeans,LDA,MF,GBDT等机器学习算法
  • 多种优化方法,包括ADMM,OWLQN, LBFGS和GD
  • 支持多种损失函数、评估指标,包含L1、L2正则项

5、算法优化

  • LDA采用了F+LDA算法用于加速采样的速度,同时利用流式参数获取的方法减少网络参数获取的延迟
  • GBDT使用两阶段树分裂算法,将部分计算转移到PS,减少网络传输,提升速度

官方开源地址: https://github.com/Tencent/angel

喜欢它别忘了去github上给它一个star!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-06-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 腾讯开源 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
联邦学习
联邦学习(Federated Learning,FELE)是一种打破数据孤岛、释放 AI 应用潜能的分布式机器学习技术,能够让联邦学习各参与方在不披露底层数据和底层数据加密(混淆)形态的前提下,通过交换加密的机器学习中间结果实现联合建模。该产品兼顾AI应用与隐私保护,开放合作,协同性高,充分释放大数据生产力,广泛适用于金融、消费互联网等行业的业务创新场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档