首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

AI在数据模糊也能解析小分子药物和催化剂的结构

intelligence can determine the 3D structure of small molecules such

人工智能(AI)在预测蛋白质的三维结构方面已经取得了巨大突破,而这些结构对于理解蛋白质功能至关重要。如今,AI的力量开始延伸至更小的分子领域,如药物、除草剂和催化剂,这些分子在医学、农业和工业化学中占据核心地位。

今日发表在《科学》杂志上的一项研究报告称,一种全新的AI工具能够在数据不完整的情况下解析小分子的结构。这一工具能够从以往被视为“无用”的数据中识别出模式,这将大大简化化学家们推进现代生活所需的多种化合物的过程。

“这真的是个游戏规则的改变者,”英国达勒姆大学的小分子晶体学家霍斯特·普施曼(Horst Puschmann)评价道,他并未参与这项研究。

AI在预测蛋白质结构方面的最新进展,主要得益于大量的训练数据。研究人员掌握了编码蛋白质的基因的DNA序列,并且对许多蛋白质的精确三维结构也了如指掌。通过这些数据集,科学家们可以训练AI,仅根据DNA序列就能准确预测出新蛋白质的未知三维形状。

然而,小分子提出了更大的挑战。哥本哈根大学的小分子晶体学家安德斯·马德森(Anders Madsen)表示,尽管研究人员可以根据化学式计算出基本的三维结构,但要确定精确的结构往往是困难的,因为许多微小的变化都可能是合理的。

为了确定实际结构,研究人员通常依赖X射线晶体学。他们首先将一批纯化的小分子转化为固体晶体,这些晶体中的分子排列成像超市里堆放的水果一样的重复图案。科学家随后用X射线照射晶体,分子周围的电子会使X射线发生偏转,产生由探测器记录的“衍射图案”。通过分析这些图案,研究人员可以绘制电子分布图,并推断出原子的排列。

然而,获取精确结构还需要了解X射线的“相位”,这是波长和穿过晶体路径的属性之一。尽管探测器可以测量X射线的强度——即每个点的光子数量,但它们无法测量相位。研究人员必须进行有根据的猜测,测试最可能的相位值,并确认最符合数据的值。但当晶体质量差,衍射图案模糊时,科学家往往无法确定相位,导致分析失败。“垃圾进,垃圾出,”剑桥大学的小分子晶体学家安德鲁·邦德(Andrew Bond)形象地描述这一过程。

然而,AI通常能够在模糊数据中看到研究人员无法察觉的模式。马德森和他的同事们决定测试这一假设。他们通过逆向工程,利用计算机模型设计出数百万个虚构的小分子结构,并计算出劣质晶体可能产生的模糊衍射图案。AI从随机相位值开始,迭代优化,直到找到与模糊强度数据结合后能产生正确结构的相位。

当研究人员获取了虚构分子的输入(强度和相位信息)和输出(3D结构)数据后,他们利用这些数据训练AI,寻找连接强度数据与相位信息的模式,从而得到正确的结构。

接下来,科学家们测试了AI在面对从未见过的真实分子时能否准确预测结构。结果显示,AI能够准确解析近2400种小分子的已知结构,并且只需传统X射线方法10%的数据量。“某种程度上,它就像魔法一样,”普施曼感叹道。

目前,这项技术仅适用于包含不超过50个原子的分子。马德森表示,他希望继续优化AI,以期能够处理更大的分子,从而使其成为一种更为通用的工具。

邦德则预见到,未来可能会有类似的AI通过其他技术的数据集进行训练,如电子束衍射,这种方法不需要制备晶体。不过目前,他表示:“这是一个非常不错的第一步。”

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OGanYxLjI06-tKL6PwACbaMQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券