AI可独立发现新的自然法则:斯坦福华人团队算法复现元素周期表

识别图像、自动驾驶、智能语音服务、下围棋,人工智能已经在诸多方面取得了惊人的成就。但是,距离人们创造出一个能独立发现新自然法则的 AI可能还有一段很长的路要走。

为了达到这一目标,最近,斯坦福大学张首晟团队创造了一个能重建化学元素周期表的 AI 程序,迈出了人工智能独立发现自然规律的第一步。新 AI 程序仅仅用几个小时就完成了元素周期表的重建。这一研究成果在 6 月 26 日发表在杂志《美国科学院院报》(Proceedings of the National Academy of Sciences of the United States of America)上。

张首晟是著名美籍华裔物理学家、美国文理科学院院士、美国国家科学院院士、中科学院外籍院士。现任斯坦福大学J.G. Jackson 和 C.J. Wood 讲座教授。

图 | 著名华人科学家张首晟

元素周期表

化学元素周期表是根据原子序数从小到大排序的化学元素列表。这一列表将化学性质相似的元素放在同一族中,进而可以准确预测各种元素的特性及不同元素之间的关系。元素周期表在化学及其他科学范畴中被广泛使用,作为分析化学行为时十分有用的框架。

随着新元素的发现和理论模型的发展,周期表的外观曾经过改变及扩张,目前,我们使用的化学元素周期表是人类科学家们花了近一个世纪才获得的。周期表可以说是化学领域最伟大的成就之一。

然而,斯坦福大学几位物理学家们开发的新 AI 程序仅仅用几个小时就完成了这个过程。

图 | 通过无模型方法,AI 获得了主族(左)和副族(右)元素向量(图源:PNAS)

该 AI 程序名为 Atomi2Vec,是一个无监督的 AI 程序。它首先分析了一个在线数据库中的化合物名字列表,之后它便能学习分辨出不同的原子,再之后该程序借用了一些自然语言处理领域的概念,通过不同的化学特性将元素分类,其借用的概念具体说来就是:要理解一些语句,可以通过观察上下文词语间的逻辑来达到目的。

自然语言处理和化学元素分类

Atom2Vec 的设计基于一个被称为 Word2Vec 的语言 AI 程序,该程序由谷歌工程师创造,用于解析自然语言。其工作原理是将单词转换为数字代码(或称为向量),通过分析向量,AI 可以判断在其他某些词汇也出现的情况下,一个特定词汇出现在文中的概率。

例如,“国王”这个词通常伴随着“王后”,“男人”伴随“女人”。因此,“国王”的向量计算可以大致写为:“国王=王后-女人+男人”。

这项研究的负责人斯坦福大学物理教授张首晟说,“对原子,我们可以应用同样的方法,只是这次我们向 Atom2Vec 输入的是所有已知的化合物,如氯化钠(NaCl)、氯化钾(KCl)和水(H2O)等,而不是用于自然语言处理的词汇和语句。”

从输入的稀疏数据中,AI 程序发现了某些规律,例如,钾(K)和钠(Na)肯定具有相似的性质,因为这两种元素都可以与氯(Cl)结合。张教授说:“正如‘国王’和‘王后’具备相似性一样,钾和钠也是相似的。”

图 | Atom2Vec 从数据库进行机器学习的工作流程(图源:PNAS)

独立发现自然规律并挑战图灵测试

然而,重建元素周期表并不是最终目的。张教授想做的是提出一个新的机器智能准则,看看是否能创造出一个 AI 程序,它能比人类更快更好的发现新的自然准则,但首先,AI 应该要有能力重复那些人类已经完成的伟大发现。

成功重建化学元素周期表证明 Atome2Vec 这个 AI 程序已具备这种重建的能力。

这是一个不错的开始。张教授说:“我们想知道 AI 是否‘聪明’到了可以独立发现元素周期规律的程度,而研究证明这个问题的答案是肯定的。”

图灵测试是用来衡量机器智能的黄金准则,一个 AI 程序若要通过图灵测试,意味着它能用人类的方式来回答书面问题,让人无法判断作答的其实是机器。

研究人员一直使用图灵测试来评估机器仿人思考的能力。虽然图灵测试在检验智能行为方面有着诸多优点,但是,这个针对人工智能的评判标准已经使用了 60 多年之久。目前,这一测试体系及其支撑理论也受到从哲学家到计算机科学家不同方面的质疑。

张教授认为,图灵测试的瑕疵在于它过于主观,他说:“人类是进化的产物,我们的思想中有着各种各样的非理性。AI 要通过图灵测试意味着它得重建人类思想中的非理性,这不仅很难做到,也并不是一种有效利用程序的方式。”

未来应用前景

除了元素周期表,张教授还希望 Atom2Vec 能应用到更多的科学研究领域。

他认为,未来科学家们可以利用 Atom2Vec 的知识来发现和设计新材料:“在这个项目中我们使用的是无监督 AI,但我们可以设想使用有监督的方式,给 AI 一个目标,并指导它找到一种能够将阳光转化为能量的高效材料。”

张教授的团队已经开始研究该 AI 程序的 2.0 版,新版程序将专注于解决医学研究中的难题:设计合适的抗体来攻击癌细胞中的特有的抗原。目前,治疗癌症的最有希望的方法之一是免疫疗法,该方法利用抗体来攻击癌细胞上的抗原。

人体可以产生超过 1000 万种独特的抗体,每种抗体都由大约 50 种基因以不同的组合形式构成。张教授说:“如果能将这些基因映射到向量上,我们就可以将所有抗体编写到类似元素周期表的表格中。如果你发现一种抗体对抗原有效但有毒,你可以在同一家族中寻找另一种同样有效但毒性较小的抗体。”

-End-

编辑:火爆麻雀,戴青

校审:戴青

参考:

https://news.stanford.edu/2018/06/25/ai-recreates-chemistrys-periodic-table-elements/

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180720B0N4G900?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券