自动化学设计——数据驱动的小分子连续描述

大家好,今天推荐一篇ACS central science上的机器学习辅助小分子设计的文章。文章通讯作者Alan Aspuru-Guzik刚从哈佛大学化学系到了多伦多大学化学和计算机系,他的实验室近期利用机器学习在化学信息学方面做出很多如生成模型、分类模型等新颖工作。在这篇文章中作者开发了化学分子的自编码器(和解码器),并得到了隐空间的连续编码,在此基础上可以对分子性质进行很好的预测和分类,并进一步,可以设计新的分子。

在本文中,作者利用深度神经网络在数十万个已知的化学小分子数据上训练了编码器,解码器以及预测器。编码器可以将离散的化学式编码成连续空间的向量,解码器可以把该向量还原回小分子。预测器可以根据连续空间向量对分子性质做出打分。这样就可以根据该打分,在连续空间进行采样和优化,优化后的连续向量利用解码器还原可以到新设计的小分子。作者在药物类似小分子的数据集和小于9个重原子的数据集上展示了该方法的有效性。

本文中的模型建立了离散的化学式和连续空间向量的映射,从而给小分子采样、打分、设计提供了更多的可能性。

本文作者:LY

文章链接: https://pubs.acs.org/doi/10.1021/acscentsci.7b00572

文章引用: doi: http://10.1021/acscentsci.7b00572

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180706B09EMB00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券