AI试管神经网络识别分子手写

中国民商

为改革发声

为民企立言

微信号:ce_china

此前我们不知道神经网络是否能学会以如此精确和可控的方式来创建图像,但这次我们发现足够深度的网络,可以在没有任何人类工程干预的情况下,学习透视和光线,这是一个非常惊人的发现

近期的《自然》杂志中发表一项研究,来自加州理工学院生物工程助理教授Lu-luQian(钱璐璐)实验室发明了一种由DNA制成的人工神经网络,可以正确识别分子数字。这项工作标志着人工智能在编入合成生物分子电路方面,迈出了重要的一步。

“尽管科学家只是刚刚开始探索在分子机器中创造人工智能,但却具有无可争辩的巨大潜力。”钱璐璐表示。相比百年前,电子计算机和智能电话已经让人类变得更有能力。与之相似的是,人工分子机器可以使所有物体分子化。在未来的百余年中,人工分子机器将更有能力和快速地对周围的环境作出反应。

人工神经网络是由人类大脑启发所得的数学模型。虽然相比生物神经网络,人工的还是太过简单,可是它已经具备了如神经元网络一样的功能,可以处理复杂的信息。钱教授实验室对于这项研究的终极目标是为DNA人工神经网络中的一系列智能行为编程(能够计算、做决定甚至更多)。

钱教授认为:“每个人类的大脑中有800亿个神经元,它们负责处理高度负责的决定,而蛔虫只能用几百万的神经元处理较为简单的决定。在这次的研究中,我们设计并创造了一种生物化学回路,它可以像小神经元网络一样,分类较从前更复杂的分子信息。”

为说明DNA神经网络的能力,钱教授实验室的研究生Kevin Cherry为人工神经网络选择了一项经典挑战任务:识别手写。人类手写千变万化,当一个人仔细识别一串数字涂鸦,大脑就会进行复杂的计算以识别出文字,即使对于人类而言识别出他人潦草的书写也是件非常困难的事情。

识别手写字母是将智能编程为人工神经网络的一项常用方法,这些网络必须“教授”如何识别数字,考虑手写时的变化,然后将未知的数字与它们所说的“记忆”相比较,最后决定数字的身份。简单来讲,所谓的DNA神经网络就是将DNA和试管作为构建神经网络的物理基础,就相当于我们通常所见的硅和晶体管。

2011年,钱教授和同事创造了首个DNA人造神经模式,但它只能识别出少量的四个模式。《自然》杂志论文的第一作者Cherry 论证了,经过严格设计的DNA序列可以实现规定的化学反应,进而正确识别分子手写。不同于几何形状多变的视觉手写,每个分子手写的例子并不能真正地呈现数字的形状。相反,每个分子数字是由选自100个分子中的独特DNA链组成,每个被分配的分子代表任意一个10×️10图案中的一个独立像素,在一个试管中这些DNA链互相融合。

给定一个分子手写的特定样本,DNA神经网络可以将手写分为9类,每一类都代表了手写1到9数字的1/9种可能。首先Cherry建立了一个DNA神经网络用以区别手写数字6和7,他测试了36个手写数字,结果试管神经网络准确地识别了所有数字。从理论上来讲,这个系统能够分类超过12000个手写数字6和7,其中90%的数字抽取自手写数字数据库。

而钱璐璐之前制造的DNA机器人,则在模拟计算机的运算过程中也派上了用场。其中的主角“入侵链”,是一个具有特定核苷酸序列的单链DNA分子;它会与另一双链DNA结合,迫使其断裂原有的氢键,释放出双螺旋的另一条链,该链叫做释放链。其中,入侵链可以看作一个输入信号,而释放链则是输出信号;输入链在释放后,可以转化为入侵链,与不同的分子反应,最终分子之间形成了一个相互作用的网络,可以模拟复杂的“输入-输出”的运算功能。

这一运算过程的关键,是利用DNA分子编码“赢者通吃”的竞争策略。在确定未知数字时,使用被称为“歼灭者”的特定DNA分子来选择优胜者,歼灭者与不同分子的竞争者形成复合体,经过反应生成不发生化学反应的物质。歼灭者迅速吃掉所有竞争者分子,直到剩下最后一个竞争者。最后,获胜的竞争者恢复到一个相当高的浓度,并产生指示网络决策的荧光信号。

“赢家通吃”的神经网络,被认为能够对数据库中98%的手写数字进行正确分类识别。而在此之前,钱璐璐就做过类似的尝试。只是在过去的实验中,仅通过4种不同的DNA分子组成的识别模型,在图像的数量与复杂性上都大大受限;相比之下,新模型具有更强大的计算力,即可以大规模“扫荡”简单图形,又可以小范围识别复杂图像。

如果在20世纪,我们因为一个手掌大小的灰色金属仪器而震惊,那么在21世纪,我们是不是会看到一碗含有智能分子的“智慧汤”:通过在汤中加入特定的原材料,我们可以训练其执行不同的任务;在一个接一个的化学反应中,“智慧汤”不断学习进化,得出结论,并以分子化合物的形式储存,形成“记忆”。这就像你对着汤抛出一个问题,它会不断的思考,最终给你答案一样。

而接下来Cherry依靠他首个DNA神经网络的原则,发展出另一个更加复杂可以在1到9之间区分单独3位数的模式,当给定一个未知数字,这个“智能汤”将接受一系列的反应并输出两个荧光信号,比如绿或黄代表5绿或红代表9。

钱教授和Cherry计划发展一种可以学习,从添加在试管中的数据例子中形成记忆的模式。钱教授表示,同样的“智慧汤”可以被训练成执行各种不同的任务。通常的医学诊断可以探测出一些生物分子的存在,比如胆固醇、血糖。使用这种更加复杂的生物分子电路,可以让医学诊断和试验的范围更加广泛,从而囊括上百种生物分子,并且在分子环境中直接对其进行分析。

不过,这些距离现实应用还有很远的距离,但科学家们期望的,不仅是将这种智能分子机器作为一个计算机的替代品,即便它或许能做出更复杂的计算与决策,我们更想看到的是,其生物属性里蕴涵着巨大的潜能。

编译自《自然》《Caltech》

  • 发表于:
  • 原文链接:https://kuaibao.qq.com/s/20180817A15OPP00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券