首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >开源项目介绍 | Angel-高性能分布式机器学习平台

开源项目介绍 | Angel-高性能分布式机器学习平台

作者头像
腾讯大数据
发布2021-06-02 12:40:17
1.1K0
发布2021-06-02 12:40:17
举报

2021腾讯犀牛鸟开源人才培养计划

开源项目介绍

滑至文末报名参与开源人才培养计划

报名提交项目Proposal

Angel项目介绍

Angel-高性能分布式机器学习平台,是腾讯研发并开源的面向企业级应用的高性能分布式机器学习平台。

Angel支持特征工程、模型构建、参数训练、AutoML、模型服务Serving等全栈机器学习服务,提供机器学习、深度学习、图神经网络等多种算法,支持级万亿级超大规模参数模型的训练,已在生产业务系统中大规模部署。

Angel项目导师介绍

欧阳文、李晓森

Angel开源项目技术负责人

导师寄语:

“Angel是腾讯自研的高性能分布式机器学习和图计算平台。通过学习这个项目,你将了解顶级分布式机器学习平台架构设计原理以及AI算法落地细节,轻松玩转机器学习和图计算,对之后的学习和工作都大有益处。”

Angel相关资料

?Angel项目地址https://github.com/Angel-ML/angel

?PyTorch on Angel:https://github.com/Angel-ML/PyTorch-On-Angel

?Angel简介、设计、算法文档:https://github.com/Angel-ML/angel/blob/master/README.md

Angel项目实战任务

编程任务

【题目一】

基于PyTorch On Angel实现S-GCN图神经网络算法;

参考论文 :https://arxiv.org/pdf/1902.07153.pdf

内容: S-GCN通过简化GCN非线性计算从而提高训练速度,在许多超大规模图场景中得到了广泛应用。

预备知识: 1.S-GCN论文 https://arxiv.org/pdf/1902.07153.pdf 2.Java , Python, Scala 3.PyTorch /Spark / Angel

预期结果: 1.基于PyTorch On Angel实现S-GCN算法 2.在多种数据集如cora.cites上有高效的训练性能以及F1-Score等关键指标 3.文档和测试

你将收获: 1.理解图神经网络算法的实现逻辑,熟悉PyTorch、Angel、Spark等组件功能 2.分布式系统的性能优化实践经验

【题目二】

基于PyTorch On Angel实现MMoE多任务学习算法模型

内容:

MMoE模型可以从数据中学习建模任务间的相关性,在许多真实场景中得到大规模的应用,如在电影推荐中不仅推荐用户可能观看的电影,还需要优化用户对电影的喜爱程度的预估;结合两个任务推荐的电影,最有可能满足用户需求和推荐目的。

预备知识: 1.MMoE论文 https://dl.acm.org/doi/pdf/10.1145/3219819.3220007 2.Java , Python, Scala 3.PyTorch /Spark / Angel

预期结果: 1.基于PyTorch On Angel实现MMoE算法 2.在多种数据集(例如MMoE论文中的数据集)上有高效的训练性能、正确的AUC等关键指标

3.文档和测试

你将收获: 1.理解图神经网络算法的实现逻辑,熟悉PyTorch、Angel、Spark等组件功能 2.分布式系统的性能优化实践经验

扫码填写问卷报名,提交项目proposal

加入开发实战

与导师一起成长这一夏

Angel开源项目交流群

更多开源项目信息,

尽在“腾讯犀牛鸟开源人才社区”

扫码加入,解锁所有学习资料

?学生指南Q&A:https://github.com/Tencent/OpenSourceTalent/issues/14

 ?官方QQ群:859260607 (加群请备注学校+专业)


腾讯犀牛鸟开源人才培养计划官网

https://opensource.tencent.com/summer-of-code

(点击文末阅读原文直接访问)

合作或疑问欢迎联系:tencentopen@tencent.com

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-06-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 腾讯大数据 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
联邦学习
联邦学习(Federated Learning,FELE)是一种打破数据孤岛、释放 AI 应用潜能的分布式机器学习技术,能够让联邦学习各参与方在不披露底层数据和底层数据加密(混淆)形态的前提下,通过交换加密的机器学习中间结果实现联合建模。该产品兼顾AI应用与隐私保护,开放合作,协同性高,充分释放大数据生产力,广泛适用于金融、消费互联网等行业的业务创新场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档