首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

助新药研发!腾讯推全球最大耐药性数据库

今天,和你分享一个消息:

我们做了一个全球最大的耐药性数据库,来帮助药物研发!

这是腾讯量子实验室的最新研究成果,相关研究论文已登上了国际学术期刊 Nature 的子刊 Communications Chemistry 。

简单说,我们搭建了一个海量的 MdrDB 耐药性数据库:

提供最全的数据信息,能为 AI 研发新药提供耐药性预测测试的「练兵场」。

看过《我不是药神》就知道:

癌症患者后期,使用的靶向药物经常出现耐药性,需要寻找新的替代药物。

但不止癌症,艾滋和抗生素药物都会产生耐药性。这是由于癌细胞和病原体的蛋白突变所导致的。

打个比方,关键蛋白是解决癌细胞/病原体的「门锁」,但由于细胞进化和药物刺激,蛋白突变几乎不可避免。

而无法预知蛋白的突变方向,就无法定向研发能够解决疾病的药物来做“钥匙”。

AI 学习,可以为预测蛋白、研制新药提速。

但全世界都面临的最大问题是——蛋白突变的数据样本不足,对耐药性测试造成了很大的数据缺口。

针对数据量不足,我们发布的MdrDB 耐药性数据库,首先在量上做到第一:

从包括 GDSC、DepMap 等公开的行业数据集内,我们搜集了接近 10万个样本,总共收纳了 240 种蛋白质(总共 5119 个 PDB 结构)、2503 个突变和 440 种药物,涵盖了各种蛋白质家族的突变信息。

这个样本量总共达到了10 万,是行业第二名的100 倍

丰富的数据量,能够为 AI 进行药物的耐药性测试提供足够的训练样本。

光是数据多,还不够——

为了让 AI 更好消化数据,量子实验室耗时半年,创新性地搭建了一套数据的加工流程:

通过细胞系的数据清洗,数据库内将野生型蛋白、突变性蛋白等蛋白质类型,单点突变、删除突变等突变类型分门别类,方便AI随时「调阅」。

最后,通过自研的Mutfold 蛋白质突变预测平台蛋白质折叠算法,能就生成一个可视化的蛋白质三维结构「锁孔」样本,可供进行药物分子的结合模拟,提供耐药性数据。

新药研发,必须经过大量的测试,以确认能够匹配突变蛋白。

更全面、更多维的数据库,能更有效助力进行突变诱导耐药性的预测、联合治疗策略的开发以及创新药物的研发。

值得一提的是,在海量数据的加持下,MdrDB 也实现了性能的突破:

在就 MdrDB 与其它行业公开耐药数据库作为训练数据、分别在10种经典机器学习模型上进行测试的实验中,与其它数据库相比,模型的预测值与真实值的均方根误差从 0.907 下降至 0.656,相关性从 0.094 提升至 0.607,耐药性的分类性能则从 0.243 提升至 0.538。

经过测试,使用 MdrDB 的AI耐药性预测精准度提升30%。

这也是自2020年打造 AI 药物研发平台云深智药(idrug)以来,我们又一次探索前沿技术助力药物研发。

目前,MdrDB 已向行业和学术机构全面开放。

未来,MdrDB 还将持续更新耐药性数据,助力国产药物研发水平提升,让科技为守护国民健康发挥更大作用。

标星我,了解更多腾讯产品动态

进入公众号 - 右上角“…” - 设为星标

  • 发表于:
  • 原文链接https://page.om.qq.com/page/ONJ8lCWpF_Nfo3RyvkJ1vQwA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券