无法使用rdkit将分子转换为指纹_如何使用rdkit将微笑转换为指纹？_无法将类型'ndarray‘转换为分子/分母 - 腾讯云开发者社区

您找到你想要的搜索结果了吗？

是的

没有找到

DGL & RDKit | 基于GCN的多任务分类模型

Nat Commun｜知识引导的分子表示学习预训练框架

2023年11月21日，清华大学曾坚阳教授（西湖大学教授）、赵诞老师团队，在Nature Communications上发表文章A knowledge-guided pre-training framework for improving molecular representation learning。

RDKit相关文章汇总

RDKit在2000-2006年期间在Rational Discovery开发和使用，用于构建吸收、分布、代谢、代谢、毒性和生物活性的预测模型。2006年6月Rational Discovery被关闭，但该工具包在BSD许可证下作为开源发布。目前，RDKit的开源开发由诺华积极贡献，其中包括诺华捐赠的源代码。

RDKit | 基于RDKit和SMARTS的化学反应处理

SMILES (Simplified Molecular Input Line Entry System)是一种分子描述语言，由Daylight C.I.S.的创始人 Dr. David Weininger 博士发明。它简单，易于理解，且广泛使用的分子描述方法。

DGL & RDKit | 基于Attentive FP的分子性质线性模型

2019年8月13日JMC（Journal of Medicinal Chemistry）刊登了一篇文章“Pushing the Boundaries of Molecular Representation for Drug Discovery with the Graph Attention Mechanism”，介绍了一种基于注意力机制的图神经网络模型（Attentive FP）。该模型可以用于分子表征，在多个药物发现相关的数据集上的预测表现达到当前最优，并且该模型所学到的内容具有可解释性。

bioRxiv|利用机器智能设计抗新型冠状病毒药物

今天介绍美国密歇根州立大学Guo-Wei Wei团队近期在bioRxiv上发表的论文，该论文利用基于机器智能的复合型生成网络(GNC)生成一系列候选药物，并测试这些药物和部分艾滋病药物对新型冠状病毒的潜在效用。

RDKit | 基于Murcko骨架聚类化合物库

一种方法是使用合适的指纹技术将化合物矢量化并评估他们之间的距离。这种方法经常被使用，但是对于人类很难直观地理解化合物之间的距离。

基于随机森林（RF）的机器学习模型预测hERG阻断剂活性

从分子相似性评估到使用机器学习技术的定量构效关系分析各种建模方法已应用于不同大小和组成的数据集（阻断剂和非阻滞剂的数量）。本研究中使用从公共生物活性数据开发用于预测hERG阻断剂的稳健分类器。随机森林被用来开发使用不同分子描述符，活性阈值和训练集合成的预测模型。与先前提取数据集的研究报告相比，该模型在外部验证中表现出优异的性能。

JCIM | 基于条件VAE的多目标分子优化

今天给大家介绍一篇最近发表在Journal of Chemical Information and Modeling 上的文章。在文章中，作者通过分子图条件变分自动编码器（MGCVAE）来生成具有指定特性的分子，并进行了多目标优化，以同时满足两个目标特性。

JCIM｜RJT-RL：一种基于化合物的可逆树表示和深度强化学习的分子设计方法

2022年8月12日，东京大学Ryuichiro Ishitani研究团队在Journal of Chemical Information and Modeling期刊上发表论文《Molecular Design Method Using a Reversible Tree Representation of Chemical Compounds and Deep Reinforcement Learning》，提出了RJT-RL，这是一个基于强化学习（reinforcement learning, RL）的分子生成和优化模型。

J.Cheminform| MACCS密钥：在逆合成预测中弥补SMILES的局限性

今天给大家介绍的是韩国江原国立大学Umit V.等人在2021年发表的一篇名为“Substructure-based neural machine translation for retrosynthetic prediction”的文章。随着机器翻译方法的快速改进，神经网络机器翻译开始在逆合成规划中发挥重要作用。作者利用无模板的序列到序列模型，将逆合成规划问题重新转化为语言翻译问题，不像先前的使用SMILES字符串来表示反应物和产物的模型，作者引入了一种新的基于分子碎片的方法来表示化学反应，并使用古本系数进行结果评估。结果表明，与目前最先进的计算方法相比，该方法能获得更好的预测结果。该方法解决了现有的逆合成方法产生无效SMILES字符串等主要缺陷。具体来说，我们的方法预测高度相似的反应物分子的准确率为57.7%。此外，作者的方法得到了比现有方法更稳健的预测。

RDKit | 基于化合物结构式图像估算分子式

当通过深度学习输入有机物质中结构式的二维图像时，需要解决寻找分子式的问题。这是一个回归问题，需要计算结构式图像中包含的碳、氢、氧和氮等原子数。

基于RDKit的Python脚本：SDF格式转SMILES格式

简化分子线性输入规范（SMILES）是一种用ASCII字符串明确描述分子结构的规范，由David Weininger和Arthur Weininger于20世纪80年代晚期开发，并由其他人，尤其是日光化学信息系统有限公司修改和扩展。

Nat. Mach. Intell. | 基于贝叶斯神经网络的类药性最小不确定性预测

今天给大家介绍的是由波兰科学院Bartosz A. Grzybowski课题组发表在“Nature Machine Intelligence”上的一篇文章“Minimal-uncertainty prediction of general drug-likeness based on Bayesian neural networks”。

Brief. Bioinform. | 从直觉到人工智能：药物发现中的小分子表征演变

今天介绍一篇2023年11月发表在《Briefings in Bioinformatics》期刊上的论文，题为“From Intuition to AI: Evolution of Small Molecule Representations in Drug Discovery”，文章的第一作者为英国爱丁堡大学的Miles McGibbon研究员和 Steven Shave研究员，以及中南大学的董界副教授，通讯作者为爱丁堡大学的Vincent Blay博士。该综述总结了药物发现领域中分子表示（表征）的演变历程，从最初的人类可读格式，逐步发展到现代的数字描述符、指纹，以及基于序列和图的学习表示。作者强调了各种表示方法在通用性、计算成本、不可逆性和可解释性等方面的优缺点。文章还讨论了药物发现领域的创新机会，包括为高价值、低数据制度创建分子表示，提炼更广泛的生物和化学知识成为新颖的学习表示，以及对新兴治疗方式进行建模。总体而言，文章聚焦于数字化分子表示在药物研发中的关键作用，同时探讨了所面临的挑战和机遇。

J Cheminform | SimVec：一种新型的基于知识图谱的药物副作用预测模型

2022年7月26日，来自JetBrains Research的Nina Lukashina等人[1]在Journal of Cheminfomatics上发表文章。文章提出了一种新方法SimVec，该方法通过使用结构感知的节点初始化和加权药物相似性边，来增强药物互相作用的知识图谱结构，并设计了一个新的三步学习过程，它迭代地更新了与副作用边缘，相似性边缘和有限知识的药物有关的节点嵌入。所提出的方法显著优于现有的模型。

J Cheminform｜ScaffoldGVAE：基于多视图的图神经网络和变分自编码器生成药物分子骨架

2023年10月4日，上海交通大学洪亮教授团队在Journal of Cheminformatics上发表文章ScaffoldGVAE: scaffold generation and hopping of drug molecules via a variational autoencoder based on multi-view graph neural networks。

DGL-LifeSci：面向化学和生物领域的 GNN 算法库

尝试使用新的DGL--LifeSci并建立Attentive FP模型并可视化其预测结果。

BIB |基于分而治之的分子图片识别深度学习框架

今天给大家介绍中南大学曹东升教授/国防科技大学吴城堃教授/浙江大学侯廷军教授团队共同在国际期刊Briefings in Bioinformatics上发表的分子图片识别的文章《ABC-Net: a divide-and-conquer based deep learning architecture for SMILES recognition from molecular images》。该文章基于分而治之的思想提出把分子识别问题转换为其组成元素的识别，包括分子键线与原子字符标识，然后使用关键点识别技术进行相关元素的识别并重新组装恢复分子结构。该方法在构造的数据集以及基准测试集上较以前的方法取得了显著的提升。

Drug Discov Today｜化学分子指纹的概念和应用

分子指纹(Molecular ﬁngerprints)可以低计算成本的方式表示大规模化学数据集中化合物的化学(结构、物理化学等)性质。它们在将化学数据集中的分子转换为适合于计算方法的一致输入格式(bit向量或数值)方面发挥着重要作用。在这篇综述中，作者将常见和最先进的分子指纹归纳并分类为8种不同类型(基于字典的、圆形的(circular)、拓扑的、药效团的(pharmacophore)、蛋白质-配体相互作用的、基于形状的、强化的和多种的)。作者还强调了分子指纹在早期药物研发中的应用。因此，本综述为药物研发使用合适的化合物(或配体-蛋白质复合物)指纹的选择提供了指南。

Chem Sci | 用机器学习策略对逆合成途径进行评估和聚类

2021年10月23日，浙江大学化学工程与生物工程学院的莫一鸣等人在Chemical Science杂志发表文章，介绍了对逆合成途径进行评估和聚类的机器学习策略。

Nat. Biotechnol. | 利用深度学习从基因转录数据中预测药物疗效

今天给大家介绍来自北京大学医学部的谢正伟团队发表在Nature Biotechnology上的文章，文章提出了一种基于深度学习的药效预测系统（DLEPS），该系统将药物SMILES分子输入神经网络来拟合药物作用下基因表达谱变化信息，从而预测疾病药物分子，该模型在测试集上的预测效果（Pearson相关系数）达到0.74；并进行了案例分析，即分别预测肥胖、高尿酸血症和非酒精性脂肪性肝炎三种疾病药物分子，随后通过构建小鼠模型验证了系统预测的候选药物的有效性，表明该系统具有通用性，可以预测多种疾病的药物分子。

MGM、MolGPT、PAR、Uni-Mol、K-Bert、MolCLR…你都掌握了吗？一文总结生物制药必备经典模型（三）

本专栏将逐一盘点自然语言处理、计算机视觉等领域下的常见任务，并对在这些任务上取得过 SOTA 的经典模型逐一详解。前往 SOTA！模型资源站（sota.jiqizhixin.com）即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐