产品概述

最近更新时间:2022-05-10 10:45:49

腾讯云隐私计算(Privacy Computing)是腾讯云推出的以联邦学习(FL)、安全多方计算(MPC)、可信执行环境(TEE)等隐私数据保护技术为基础的隐私计算平台,产品针对机器学习算法进行定制化的隐私保护改造,保证原始数据不出本地即可完成联合建模,同时支持安全多方 PSI(隐私保护集合求交技术)、安全隐私查询、安全统计分析,提供基于硬件的 TEE 可信执行环境。通过腾讯云隐私计算,各合作机构既能保障数据安全,又能发挥数据最大价值,很好地解决了业界数据孤岛的难题。

产品功能

腾讯云隐私计算平台包含了联邦学习(FL)、安全多方计算(MPC)、可信执行环境(TEE)3个部分,平台目前提供了节点管理、数据接入、安全求交、特征工程、数据分析、模型训练、模型管理等功能。

节点管理

在完成隐私计算平台部署后,需要在前端控制台进行隐私计算节点注册,用户可以添加、删除节点,在添加节点时会进行节点校验,校验通过的节点之间即可开始数据合作。

数据接入

腾讯云隐私计算平台可以直接对接大数据生态,支持分布式文件存储系统 HDFS 及本地文件系统,能够灵活地适应用户的实际情况。在整个流程中都不涉及用户数据上传,仅是在平台注册数据。

数据检测

在注册数据流程中需要进行数据本地检测,检测数据格式是否符合规范。例如,是否使用相同的用户 ID 主键、是否是相同的时间粒度、是否使用相同的加密方法等,只有双方/多方数据都符合规范才能进行数据合作。

安全求交

在纵向联邦场景中,模型训练之前都需要基于交集 ID 准备数据,安全求交可以轻松帮助合作双方进行 ID 对齐。在 ID 敏感的场景,依托于隐私求交及首创的非对称联邦技术,平台还能有效解决样本 ID 交集泄露的问题。

特征工程

特征工程是模型训练中必不可少的环节,通过联邦定制化改造,平台已经支持分箱、特征过滤、OneHot、缺失值填充、单变量衍生等主流特征工程。

数据分析

在联邦模型训练过程中,算法人员通常都需要对入模特征的统计分布、相关性等作出深入了解。针对多方数据,在保护各方数据隐私的前提下,做统计、相关性等联合数据分析。

模型训练

本平台目前支持 LR、XGBoost 两种算法,基于联邦学习协议对算法进行定制化改造从而达到无损的模型训练效果,基本已满足主流的纵向联邦场景。同时,平台正在适配 MLP、DSSM(双塔)、Deep&Wide 等算法,从而能更好的支持大数据量的推荐场景。

模型管理

模型训练完成后会生成对应的模型实例,在算法人员调试模型的过程中一般会生成多个模型实例,模型管理能帮助算法人员更好地对比模型参数和效果数据,从而有针对性地优化模型。模型管理包括删除模型、查看日志、模型上线、模型下线等功能。

在线服务

模型训练完成后就需要将其发布上线供业务侧实时调用,同时在线服务还实现了实时匿名查询等功能,能避免因为查询而暴露真实客户 ID。

调用统计

统计合作双方机器学习模型和安全查询调用次数,方便进行统计结算。