美俄科学家联合运用神经网络研制抗癌药物

据俄罗斯物理技术研究所报道,莫斯科物理技术学院(MOSCOW INSTITUTE OF PHYSICS AND TECHNOLOGY,MIPT)、InSilico医药公司和俄罗斯互联网集团Mail.Ru的研究人员首次将生成神经网络(Generative Neural Network, GNN)用于研发具有特定属性的新药。利用他们所开发和训练的生成式对抗网络(Generative Adversarial Network, GAN)“发明”的新分子结构,将可以大大减少寻找具有潜在药物特性的物质所耗费的时间和成本。研究人员计划在肿瘤、心血管疾病甚至抗感染等多个医疗领域中利用这些技术来寻找新药。该研究的初期成果在2016年6月提交到肿瘤期刊《Oncotarget》,历经了几个月的评审。自那时起,该研究团队对系统做了许多改善,并与一些领先的医药公司合作。

目前,无机分子基(inorganic molecule base)包含了数以亿计的物质,但其中只有少数能用于医疗药物。研制药物的药理学方法通常是基于前人的研究成果。例如,阿司匹林被用作药物已经有很多年的历史,但药理学家可能会继续对其展开研究,在不改变其物质的前提下,为该化合物增加其他成分以减少副作用、提高药效。2017年初,Insilico医药公司的科学家证明,可以运用深度神经网络大幅缩小研究范围。但是现在他们正专注于一个更具挑战的问题:是否有可能利用经数百万分子结构训练的深度神经网络去创造具有医疗属性的、概念上的新分子?

生成式对抗自编码(Generative Adversarial Autoencoder,GAA)架构是生成式对抗网络的延伸。研究人员以它为基础,用已知医学特性和有效浓度的化合物来训练系统。将这些化合物相关的信息输入网络并进行调整,从而在输出中得到相同的数据。该网络本身由三部分构成:编码器、解码器和鉴别器,其中每一部分在与另外两部分“合作”的过程中都发挥着自己特定的作用。编码器与解码器一起压缩、恢复原型化合物的信息,而鉴别器则使压缩后的信息更适合恢复。一旦网络已经学习了大量的已知分子结构后,编码器和鉴别器就会“关闭”,网络就能用解码器自动生成对分子的描述。

要开发基于文本输入而生成高质量图像的生成式对抗网络不仅需要具备丰富的专业知识,还需要在高性能计算设备上进行长时间的训练。但是,有了图像和影像,人类就可以快速执行输出的质量控制。在生物学中,仅靠人眼判断并不能实现质量控制,产生大分子还需要做大量的验证实验。

在系统中,所有分子均表示为简化分子线性输入系统(Simplified Molecular Input Line Entry System,SMILE)格式或允许结构被恢复的化学物质图形注释(graphical annotations)。学校里教的标准注册(standard registration)并不适用于网络处理,但简化分子线性输入系统格式亦是如此,因为这种格式的长度随机,从1个符号到200个符号不等。而神经网络训练要求向量的描述长度相等。分子“指纹”能解决这个任务,因为它包含了整个分子的完整信息。现在有很多种方法来制造这种“指纹”,研究人员采用了最简单的二进制方法,有166位。他们将简化分子线性输入系统格式转化为指纹,再用其训练神经网络,然后就可以将已知药品化合物的指纹输入神经网络。神经网络的工作是分配内部神经元参数权重,这样特定的输入产生特定的输出。该操作重复多次,这就是利用大量数据进行训练的方式。所以,研究人员就创建了可以针对特定输入产生特定输出的“黑匣子”,随后,他们移除第一层神经网络,信息再次输入时神经网络能够自动生成指纹。科学家因此为全部7200万个分子建立了“指纹”,再将其与网络生成的指纹进行比较。所选的分子必须具有某些潜在特性。

研究人员表示,“我们创造了一个再生性(reproductive type)的神经网络,即可以生成与神经网络训练范例相似的对象。最终,我们让该网络模型学会了根据特定属性创建新的指纹。”

研究人员还利用抗癌药物数据库来检测网络。使用其中一半的药物化合物对神经网络进行训练,再通过另一半化合物进行检测。目的是预测未包含在训练集内的已知化合物。目前,有69种预测的化合物已得到了确认,研究人员正利用这种方法的强大扩展手段研发数百种分子。

研究人员表示,“与许多流行的深度学习方法不同,生成式对抗网络直到2014年才被提出,现在科学家仍然在探索它在生成有意义的图像、视频和美术品、甚至音乐作品等方面的强大性能。它的发展速度在不断加快,不久我们就会看到生成式对抗网络联合其他方法带来的巨大进步。我们团队所做的一切都是为了让人类活得更长寿、更健康、更富有活力。当人类踏上火星,就会需要这些工具来更有弹性地面对各种压力,按需生成各种高效药物。我们就是提供这类工具的团队之一。”

Mail.Ru集团搜索优化团队首席程序员、Insilico Medicine独立科学顾问总结道:“生成式对抗网络是神经科学领域的前沿研究领域。很明显,它不仅仅可用于生成图像和音乐这类简单的任务,还可执行更广范围的任务。我们已经借助生物信息学与已知的大量成果试验了这种方法。”

原文发布于微信公众号 - 人工智能快报(AI_News)

原文发表时间:2017-03-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏SIGAI学习与实践平台

­­­­理解计算-从根号2到AlphaGo 第4季 凛冬将至

原创声明:本文为 SIGAI 原创文章,仅供个人学习使用,未经允许,不能用于商业目的。

862
来自专栏CVer

CVPR 2018 获奖名单:最佳论文和最佳学生论文共计5大奖项

CVPR 2018大会刚刚发布了最佳论文奖、学生最佳论文奖、最佳论文鼓励奖、十年检验奖和青年学者奖等共计5项大奖。

1276
来自专栏PPV课数据科学社区

500款各领域机器学习数据集,总有一个是你要找的

金融 美国劳工部统计局官方发布数据:http://dataju.cn/Dataju/web/datasetInstanceDetail/139 沪深股票除权除息...

1.2K11
来自专栏AI科技评论

【业界】谷歌 DeepMind 的可微分神经计算机 DNC 怎么样?看 Facebook AI 研究员田渊栋、贾扬清怎么说

田渊栋,卡耐基梅隆大学机器人系博士学位、上海交通大学硕士学位和学士学位,前谷歌无人车项目组成员,现任 Facebook 人工智能组研究员,主要负责 Facebo...

3475
来自专栏思影科技

基于局部脑血流量和工作记忆表现预测2年内血压变化

贝叶斯推荐你关注思影科技 来自美国匹兹堡大学精神病与心理学部的J.Richard Jennings等人在Hypertension杂志上发文指出,基于ASL成像的...

3146
来自专栏机器之心

从Yoav Goldberg与Yann LeCun争论,看当今的深度学习、NLP与arXiv风气

选自Medium、Facebook 机器之心编译 作者:Yoav Goldberg、Yann LeCun 参与:黄小天、吴攀、晏奇 最近,来自以色列 Bar ...

2567
来自专栏量子位

听说你刚中了NIPS?恭喜(研究德扑、老鼠胡须等AI的都入围了)

允中 发自 凹非寺 量子位 出品 | 公众号 QbitAI ? 今天凌晨,NIPS 2017开始揭榜。 作为机器学习领域的顶级会议,NIPS 2017共收到32...

3404
来自专栏新智元

【ICCV 13大不可错过的有趣项目】实时任意风格迁移、手机照片背景模糊……

来源:techcrunch 作者:Devin Coldewey 编译:马文 【新智元导读】计算机视觉领域顶会之一的 ICCV 结束不久,图像质量提升、从头创建...

3437
来自专栏SIGAI学习与实践平台

理解计算-从根号2到AlphaGo 第4季 凛冬将至

在新中国诞生的那一年,加拿大生理学家唐纳德﹒赫布(Donald O. Hebb)出版了《行为的组织》 (《The Organization of Behavio...

562
来自专栏机器人网

顶级AI会议NIPS压轴2017

NIPS,全称神经信息处理系统大会(Conference and Workshop on Neural Information Processing Sys...

3558

扫码关注云+社区