首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

MIMOSA: 用于分子优化的多约束分子采样

今天给大家介绍一篇佐治亚理工学院Tianfan Fu等人发表在AAAI 2021上的文章“MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization”。分子优化促进药物发现,其目标是产生新的有效分子,使药物特性最大化,同时保持与输入分子的相似性。现有的生成模型和强化学习方法在同时优化多种药物属性方面仍面临一定困难。为此,本文提出多约束分子采样框架—MIMOSA,使用输入分子作为初始采样框架,并从目标分布中采样分子。MIMOSA首先预先训练两个属性不可知图神经网络(GNN),分别用于分子拓扑和子结构类型预测,其中子结构可以是原子或单环。MIMOSA用GNN进行迭代预测,并且采用三种基本的子结构操作(添加、替换、删除)来生成新的分子和相关的权重。权重可以编码多个约束,包括相似性约束和药物属性约束,在此基础上选择有前途的分子进行下一次预测。MIMOSA能够灵活地对多种属性和相似性约束进行编码,且高效地生成满足各种属性约束的新分子,在成功率方面比最佳基线改进高达49.6%。

04

如何对非结构化文本数据进行特征工程操作?这里有妙招!

文本数据通常是由表示单词、句子,或者段落的文本流组成。由于文本数据非结构化(并不是整齐的格式化的数据表格)的特征和充满噪声的本质,很难直接将机器学习方法应用在原始文本数据中。在本文中,我们将通过实践的方法,探索从文本数据提取出有意义的特征的一些普遍且有效的策略,提取出的特征极易用来构建机器学习或深度学习模型。 研究动机 想要构建性能优良的机器学习模型,特征工程必不可少。有时候,可能只需要一个优秀的特征,你就能赢得 Kaggle 挑战赛的胜利!对于非结构化的文本数据来说,特征工程更加重要,因为我们需要将文

06
领券