文章/答案/技术大牛

发布

看“联邦学习”如何破局数据孤岛壁垒

文章来源：企鹅号 - 杭州有盾

Tips：

纯技术贴也有好看点~

本文共计：1670字

阅读时间：5分钟

人工智能时代的信息孤岛

在当前的人工智能时代，算法与算力是推动时代发展的基石，而数据是最重要的资源，拥有了大数据，算法才能发挥它的威力。我们的日常生活会产出各种各样的数据，例如出行、购物、通讯、消费等数据，而这些数据都各自分布在不同的公司手中，若是能够共享数据就可以提升算法效果，提高用户的产品体验，催生更多的人工智能的应用。但问题在于，数据共享和数据保护似乎难以同时保障，如果要共享数据，数据的安全就容易受到威胁；如果要严密地保护数据，那么一个个信息孤岛就难以打破。

什么是联邦学习？

联邦学习是一种加密的分布式机器学习技术，它可以加密模型参数，参与各方可以通过交换加密模型参数来更新模型参数，从而建立一个虚拟的共有模型，这个虚拟模型的效果几乎等于把数据汇聚在一台机器上建模的效果。在整个建模过程中，数据本身不会发生移动和交换，只需要在加密状态下找出共有用户，也不会泄露用户隐私，各方就能获得模型为本地服务。

联邦学习是如何工作的

数据孤岛具有不同的分布特点，大致分为：横向联邦学习、纵向联邦学习、联邦迁移学习三种方案。

来源网络

横向联邦学习是指参与各方的用户特征重叠较多，但是用户重叠较少，将数据按照用户维度切分，取出各方特征交集但用户不完全相同的部分数据组合训练，即扩充训练样本。

纵向联邦学习是指参与各方的用户特征重叠较少，但是用户重叠较多，将数据按照特征维度切分，取出各方特征并集且用户相同的部分数据组合训练，即扩充特征维度。

联邦迁移学习是指用户和用户特征重叠较少的情况下，不对数据进行切分，而通过迁移学习来缓解数据规模小、标签样本不足的情况。

联邦学习作为一种保障数据安全的建模方法，在销售、金融等行业中的应用前景广泛。由于此行业受到知识产权、隐私保护、数据安全等因素影响，数据无法被直接聚合来进行机器学习模型训练。

案例：联邦学习在金融信贷的应用

来源网络

假设A公司为信贷公司，需要构建一个信贷逾期预测模型，该公司只拥有用户的贷后表现和申请行为数据；B公司为支付公司，拥有大量的用户交易数据。C为协作者，专门提供数据传输、模型参数汇总和分发密钥。

STEP 1

A公司与B公司利用系统基于加密的用户样本对齐技术，确认双方的共同用户，在各自的本地环境准备用户的特征属性。

STEP 2

协作者C将公钥分发给A和B，A和B使用公钥和同态加密技术加密训练过程的中间结果，然后互相交换中间结果，最后计算加密的梯度值和损失值，这些结果汇总给协作者C。

STEP 3

协作者C将解密后的梯度分别回传A和B，A和B根据梯度更新各自模型的参数。

重复迭代上述的2、3步骤直至损失函数收敛，完成整个模型的训练。在整个训练过程中，A和B的数据都保存在各自本地环境中，传输的都是中间的加密数据，不会泄露用户的隐私，同时收获了效果更加优秀的模型。

走在技术前沿

有盾网络在联邦学习的成效

有盾网络的大数据团队一直致力于前沿的金融科技技术的研究和应用，目前已将联邦学习应用于公司的实际业务场景中。今年年初，我们与某家互金客户达成战略合作，成功建立联合风控模型，使用自有数据在联邦学习的框架下进行纵向联邦学习，通过加密版本的XGBoost算法训练模型，帮助该客户将模型效果KS提升至30%以上，约近一倍的提升。结合有盾丰富的数据覆盖度，联合训练的模型提供商户风控决策，逾期率降低10%。

来源网络

随着联邦学习理论、应用体系的逐渐丰富，运算效率得到高效提升。联邦学习目前面临的问题诸如模型的训练效率较低、高效的分布式加密算法、统一技术标准等也将逐渐解决，在保障数据隐私安全性和合规性的前提下形成一个数据与知识共享的生态体系。

在联邦学习的效果激励下，越来越多的公司愿意加入到这个体系，中小型公司有机会在这个体系下产生优秀的人工智能应用，大公司也可提升用户的产品体验，不同领域的公司也可以在联邦学习的驱动下提升数据价值，实现合作共赢。有盾网络也将借助这项技术为泛金融领域和生活服务型企业提供更加优质，精准的服务。

内容：大数据团队

图片：源自网络

发表于: 2019-08-162019-08-16 14:58:25
原文链接：https://kuaibao.qq.com/s/20190816A0FP4J00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

看“联邦学习”如何破局数据孤岛壁垒

相关快讯

扫码

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐