用生物大分子来做模式识别

大家好。本周分享的是发表在Nature上的一篇关于DNA circuit的文章Scaling up molecular patternrecognition with DNA-based winner-take-all neural networks,通讯作者是California Institute of Technology的Qian lulu教授,课题组的主要研究方向是人工合成核酸体系的分子编程,研究涉及生化分子环路,DNA神经网络和分子机器人等。

分子水平的模式识别对于生物有机体实现其基本功能起着至关重要的作用,在此之前,研究者们已经报道了使用基于线性阈值环路和Hopfield环路的DNA的神经网络来处理这类问题,但是其能够处理的规模有限,仅能够识别不超过四个模式,其中每个模式由4种不同DNA分子构成的。在本篇文章中,作者采用的是被称为“winner-take-all”的环路设计,看中的是其在计算上的能力更强,且能更好的摆脱待识别的模式的数量和复杂程度的限制。利用本课题组在之前所开发的跷跷板DNA,通过巧妙设计DNA序列,以某种DNA分子的浓度对应于神经网络架构中的每一个节点的信号值,作者在规模由小到大、模式种类由简单至复杂的多个测试集上测试了这种基于“winner-take-all”策略设计的DNA环路对MNIST手写数字数据集的识别能力。并且他们还验证了,当人为加入一些“污染”时,分子环路仍然可以有效的依据相似性来完成分类,显示出其对高复杂度和噪声环境的忍耐性。

具体来讲,本文所设计的网络可以分为五个部分,每个部分都可以通过DNA之间的简单反应来实现:1.权重乘法。在网络上这一步指的是二进制(0或1)的输入xi乘以权重wij,对应的反应是物质Xi催化Wij反应生成中间产物Pij。只有在Xij存在时才会生成Pij,并且Pij的浓度由Wij决定,即Wij的浓度成为了权重值。2.加权求和。在网络中这指的是i个输入对j个中间节点的加权求和。分子反应上,SGj能够与同一神经元内的所有中间物质Pij反应,生成Sj。3. 成对湮灭,赢家通吃。这是非常有趣的一步设计。Winner-take-all,即赢家通吃计算是一种简单的竞争神经网络模型,在这个模型中,只有二进制输入的加权和最大的神经元的输出才会开启。这一步的分子反应被称为“成对湮灭”,不同种类的Sj之间对相互结合发生湮灭,也可以说是每个Sj会破坏他的竞争者Sj,直到剩下最后一个Sj——浓度最高的胜利者。4.信号恢复。Sj与恢复物质RGj结合,生成输出物质Yj。5.荧光报告输出。荧光报告基团Repj与Yj结合,检测荧光信号的强度对应于Yj的输出信号值。上述反应利用的是DNA分子的跷跷板反应和协同杂交,通过DNA链之间的置换和迁移来实现,对于权重分子的选择,他们简单地使用了目标模式作为权重。

作者首先考察了赢家通吃策略的可行性,使用两个加权和链S1和S2进行实验,接下来使用完整的网络验证了该分子环路对4位模式识别的能力。作者在文章中还提出了针对该环路的三个问题:可以同时处理的目标模式的数量,是否可以识别有污染或损坏的模式,复杂程度较高时DNA环路的尺寸变化,并在后文中使用MNIST一一回答了这些问题。在1-9数字分类问题时,考虑到单独的成对湮灭方法对于大规模模式识别的局限,作者采用了分组的策略,通过两组输出特异识别一种数字,有效节约了运算时间和环路尺寸。

本文构筑了一个新鲜有趣的生化分子环路,在面对复杂程度较高且存在污染的模式识别问题时表现出了很好的分类效果。作者认为赢家通吃策略和以目标模式作为权重的方法对于进一步扩展DNA神经网络值得探索。

作者:CY

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180718B0EKSY00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券