2021年10月14日,在首届“上海国际生物医药产业周(IBIWS)”期间,国内隐私安全计算的代表企业翼方健数受邀参加“2021人工智能药物研发论坛”。论坛期间,作为翼方健数的合作伙伴,燧坤智能CEO曾亥年为观众分享了隐私安全计算技术在AI药物发现过程中的重要应用。翼方健数副总裁张莺耀参与了题为“AI与制药行业的合作”的圆桌讨论。
隐私安全计算是一个全新的概念。从技术层面来讲,隐私安全计算包含多种计算模式,其中较为常见的有安全沙箱计算/TEE、联邦学习、多方安全计算、同态加密等。通过使用这些前沿的技术手段,隐私安全计算得以解决数据安全和数据共享这两者之间的矛盾、最终实现在保护数据资产安全的前提下完成数据协作,实现数据价值的挖掘、流通和合理分配。
翼方健数副总裁张莺耀参加讨论
2021 年5 月,上海市发布《关于促进本市生物医药产业高质量发展的若干意见》,提出要打造以“张江药谷”为引领的张江生物医药产业集群和品牌,统筹协调打造出世界级生物医药产业集群。张江生物医药产业在创新策源、科创生态等多方面全球布局,于2021 年10 月11-15 日期间举办上海国际生物医药产业周——“张江生命科学国际创新峰会”,打造了一个具有全球地标意义和引领作用的生命科学产业国际会议。
隐私安全计算:不共享原始数据,共享数据的价值
AI制药领域持续发展的核心基础之一是持续不断增加的数据资源。数据质量不佳、特定任务可用的数据过少、以及负样本数据缺失等常见问题是制约AIDD发展的关键原因。因此,通过隐私安全计算促进数据协作,使丰富、高质量的数据安全地用于模型训练,对于AI制药行业有着重要的意义。
解决数据孤岛问题的隐私安全计算技术,在药物发现领域已有实例。
以联邦学习为例,2019年6月1日,由10家顶尖制药企业(安进、安斯泰来、阿斯利康、拜耳、勃林格殷格翰、葛兰素史克、杨森制药、默克、诺华和施维雅)、2所欧洲大学、4家初创公司、1家AI药物研发公司共同发起的MELLODDY项目开始运行。MELLODDY旨在创建一个建模平台,在该平台上利用多家制药企业的数据,不中心化原始数据,通过分布式数据协作,从而建立更好的AI模型,更高效地发掘数据的价值,加速药物研发。
翼方健数提供多种隐私安全计算方式
翼方健数的技术栈支持多种主流的隐私安全计算方式,包括多方安全计算MPC、联邦学习、安全沙箱计算/TEE,此外还有差分隐私,对抗神经网络等。根据用户的使用场景、信任假设的不同,翼方健数帮助客户选择最合适的计算方式。
根据信任假设和计算复杂度要求,可以选择不同合适的计算方式
以下是其中几种技术的简单介绍。
安全沙箱技术
安全沙箱的计算环境,是一个对包括管理员在内的用户完全隔离的计算黑盒。处于加密状态的模型和数据进到沙箱后完成解密,模型对数据进行运算,运算得到的结果加密后传输到沙箱外,然后沙箱环境随即销毁,确保模型代码以及数据的安全。
燧坤智能和翼方健数的协作主要用到安全沙箱计算
可信执行环境
在沙箱环境外增加可信执行硬件TEE会对内存加密,规避了恶意的平台操作系统窃取模型代码及数据的风险,由此进一步提高了沙箱的安全性。翼方健数是信通院首批通过TEE测评的企业,并参与制定进一步测评的标准。
可信执行环境进一步提高了安全性
全面支持跨平台联邦学习
联邦学习技术利用多个数据所有方的数据分布式地训练同一个机器学习模型,过程中各方原始数据不离开自己的平台,使多方得以安全协作、共同发掘数据价值。
翼方健数开发了一整套联邦学习的框架,同时也支持通用的FATE、TF、Paddle等框架,全面支持跨平台联邦学习,目前已通过工信部信通院联邦学习标准评测。
翼方健数的跨平台联邦学习
翼方健数期望通过前沿的隐私安全计算赋能AI药物研发行业中的多方协作,加速新药研发,最终使患者获益。
----------- End -----------