前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >联邦学习,为何而生?

联邦学习,为何而生?

作者头像
AI科技大本营
发布2023-05-08 13:40:58
1960
发布2023-05-08 13:40:58
举报
文章被收录于专栏:AI科技大本营的专栏

隐私数据是否早已泄露,而我们却毫无察觉?

随着大数据、边缘计算、大型云计算平台和各种开源框架的发展,机器学习等人工智能技术以前所未有的速度应用到各个行业,人工智能技术带来了新的挑战,数据的隐私和安全引起了全世界的重视。

对此,欧盟曾经发布《通用数据保护条例》,中国也推出了相关规定限制金融数据的使用。

数据使用的限制使得互联网数据分散在不同企业、组织中,形成了“数据孤岛”现象,各方数据不能直接共享或者交换

因此,如何在解决“数据孤岛”问题的同时保证数据隐私和安全,成为各界最关注的事情。这正是联邦学习(Federated Learning,FL)要研究的问题。

政府部门“数据孤岛”、数据运营商“数据孤岛”、企业“数据孤岛”示意图

(虚线表示无法流通,彼此独立)

从国内的现状来看,数据主要掌握在政府部门、数据运营商、企业三大“数据孤岛”中。数据被独立地存储于各个“孤岛”中,使得数据的共享十分困难。

结合目前国内外的企业、组织的数据存储现状和法律法规对数据共享的限制,“数据孤岛”问题面临多个难点

1. 安全分享难,这不仅是数据管理技术的需求,还涉及信任问题。 2. 利用难,由于数据来源于不同的企业和组织,很可能在数据格式方面不统一,那么在融合时就会出现问题。 3. 传输难,即使可以交给对方或可信任的第三方,难以保证各方的传输速度及成本。 4. 定价难,数据作为一种无形资产,其价值也随着应用场景不断变化,因此数据产权难以确定、交易标的难以确定。

联邦学习提供了一种解决数据安全和“数据孤岛”问题的可行性方向

通过多方安全计算协议,密码学,以及差分隐私等相关技术,通过数据不动,模型动的思想,在保护各方数据隐私的前提下打通了孤岛,充分挖掘利用了各方数据的价值。

纵向联邦学习训练示意图

联邦学习有如下几点优势:

1. 数据隔离,数据不会泄露到外部,满足用户隐私保护和数据安全的需求; 2. 能够保证模型质量无损,不会出现负迁移,保证联邦模型比割裂的独立模型效果好; 3. 参与者地位对等,能够实现公平合作; 4. 能够保证参与各方在保持独立性的情况下,进行信息与模型参数的加密交换,并同时获得成长。

学术界,联邦学习已经逐渐成为了顶会的热门主题。

在今年几场重磅会议中,联邦学习相关的论文数量相较去年明显增多,其中IJCAI 2020有20篇,AAAI 2021共18篇 ICLR 2021共15篇。

对于工业界而言,联邦学习俨然已经成为了解决数据孤岛问题的一项利器。

很多互联网企业纷纷投入研发资源,并进行市场布局。这项技术于 2016 年被谷歌提出,在 2019 年年初被引入国内,在 2020年即已出现数十家企业提供的产品,并出现了大规模的商业应用。

从技术层面来看,联邦学习是密码学、分布式计算、机器学习三个学科交叉的技术,需要掌握跨领域的综合知识。

并且越来越多的人关注到联邦学习这个新兴技术,希望系统地掌握联邦学习的原理,并在产业应用中解决具体问题。

《联邦学习技术与实战》正是在这样的背景下撰写和出版的。

本书由京东科技集团风险管理中心总监彭南博,以及京东科技集团风险管理中心算法科学家王虎撰写,两位均于2012年在中科院大学获得博士学位。

彭南博在人工智能算法、风控模型等领域具有丰富的实践经验。领导团队研发联邦学习技术和产品、模型管理体系、监控体系等。

王虎则负责联邦组网过程中的算法研究和模型优化,在联邦学习产品化、探索实践的过程中积累了大量经验。

本书基于实战经验撰写,详细地介绍了相关技术的原理和实战经验。

不仅深入浅出地讲解了具体的联邦学习算法,联邦交集计算以及联邦特征工程等理论知识,同样针对实践过程中可能遇到的通信、资源不足等问题给出了优化方案。在此基础上结合丰富的产业经验,对于联邦学习与其他领域的结合场景,如何设置激励机制和定价模型等问题,也给出了详细的解答。从多个维度帮助读者解决了联邦学习是什么,怎么用的问题,具有极强的实用价值。

▼希望本书可以带你进入联邦学习的世界,从此轻松连接数据孤岛!

本书针对产业界在智能化过程中普遍面临的数据不足问题,详细地阐述了联邦学习如何帮助企业引入更多数据、提升机器学习模型效果。互联网数据一般分布在不同的位置,受隐私保护法规限制不能共享,形成了“数据孤岛”。联邦学习像“数据孤岛”之间的特殊桥梁,通过传输变换后的临时变量,既能实现模型效果提升,又能确保隐私信息的安全。

本书介绍了联邦学习技术的原理和实战经验,主要内容包括隐私保护、机器学习等基础知识,联邦求交、联邦特征工程算法,三种常见的联邦形式,以及工程架构、产业案例、数据资产定价等。

对于联邦学习,你有哪些见解呢?

#欢迎来评论区讨论#

AI科技大本营 将选出三名优质留言

携手【博文视点】送出

《联邦学习技术与实战》一本

截至4月26日14:00点

60+专家,13个技术领域,CSDN 《IT 人才成长路线图》重磅来袭!

直接扫码或微信搜索「CSDN」公众号,后台回复关键词「路线图」,即可获取完整路线图!

代码语言:javascript
复制
更多精彩推荐
代码语言:javascript
复制
☞270亿参数的“中文版GPT-3”来了!阿里达摩院发布超大规模语言模型PLUG☞Azure 中国四年扩容 12 倍还不够,微软放话:全球每年新建 50-100 数据中心!☞微软每年豪砸安全研发 10 亿美元,聊聊背后的技术密码
代码语言:javascript
复制
点分享点收藏点点赞点在看
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-04-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI科技大本营 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
联邦学习
联邦学习(Federated Learning,FELE)是一种打破数据孤岛、释放 AI 应用潜能的分布式机器学习技术,能够让联邦学习各参与方在不披露底层数据和底层数据加密(混淆)形态的前提下,通过交换加密的机器学习中间结果实现联合建模。该产品兼顾AI应用与隐私保护,开放合作,协同性高,充分释放大数据生产力,广泛适用于金融、消费互联网等行业的业务创新场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档