开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

使用rdkit或其他python模块将微笑转换为化学名称或IUPAC名称

化学名称是一种用来描述和命名化学物质的系统命名法。为了将微笑（分子结构的图形表示）转换为化学名称或IUPAC（国际纯粹和应用化学联合会）名称，可以使用rdkit这个强大的Python模块，它是一种开源的化学信息学工具包。

rdkit提供了一系列的功能，包括分子结构的表示、化学信息的处理和分析、化学反应的模拟等。要将微笑转换为化学名称，可以使用rdkit中的Chem模块。首先，需要将微笑转换为分子对象，然后使用Chem模块中的函数获取化学名称。

以下是使用rdkit将微笑转换为化学名称的示例代码：

from rdkit import Chem
from rdkit.Chem import ChemicalName

smiles = "CC(=O)OC1=CC=CC=C1C(=O)O"
mol = Chem.MolFromSmiles(smiles)
name = ChemicalName.GetPreferredIUPACName(mol)

print("微笑表示:", smiles)
print("化学名称:", name)

运行以上代码，输出结果将包括微笑表示和相应的化学名称。

rdkit还提供了其他强大的功能，例如化学反应的模拟、分子描述符的计算、相似性分析等。可以通过rdkit的官方文档（https://www.rdkit.org/docs/）了解更多详细信息。

腾讯云提供了丰富的云计算相关产品和服务，例如云服务器、云数据库、容器服务、人工智能服务等。这些产品可以在云端部署和运行各种应用程序，包括化学信息学的相关任务。详细的产品信息和介绍可以在腾讯云官方网站（https://cloud.tencent.com/）上找到。

注意：本回答仅提供了rdkit在将微笑转换为化学名称方面的应用示例，如果需要更深入、全面的回答，建议参考相关化学信息学和化学命名法的资料。

相关搜索:base64 :如何使用speech_recognition或其他模块将Python音频字符串转换为文本？python使用名称模式或其他签名调用所有函数使用hashlib或其他方法将Java MD5 `java.security.MessageDigest.getInstance("MD5")`代码转换为Python2.7 如何使用pyqt5将python代码转换为图形用户界面？(禁止使用qt设计器或其他应用程序，我必须自己编写代码)如何使用Python将音频文件(.mp3或.wav或任何其他文件)转换为唯一的音频id？如何在python中使用PIL将文本放在图像上居中，并在for或while循环中使用不同的名称保存图像？linux密码输入次数 linux明文配置密码 linux命令查看网页 linux命令复制文本

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

科研人再也不担心有机物命名不规范了：基于Transformer的开源工具自动起名

作者/凯霞「有机化合物怎么命名啊？」、「有机化合物命名规则是什么？」、「这个药物的有效成分叫什么？」、「有没有查找有机化合物命名的软件或程序？」、「某某命名软件还花钱。」、「某软件命名不准确。」...... 注：部分来自知乎问题。总之，有机化合物命名太难、规则太繁琐、还没有开源软件...... AI 发展「风生水起」，能否解决以上问题？现在，来自莫斯科罗蒙诺索夫国立大学和 Syntelly 初创公司的研究人员开发了一种基于 Transformer 的人工神经方法，可根据 IUPAC 命名系统生成

02

GPT模型在化学领域可以做些什么？

今天为大家介绍的是来自Xiangliang Zhang团队的一篇关于GPT能力讨论的论文。大型语言模型（LLMs）在自然语言处理任务中具有强大的能力，并迅速应用于科学、金融和软件工程等各种领域。然而，LLMs在推动化学领域的能力尚不清楚。作者建立了一个包含8个实际化学任务的全面基准，包括1）名称预测，2）属性预测，3）收率预测，4）反应预测，5）逆合成（从产物预测反应物），6）基于文本的分子设计，7）分子描述，和8）试剂选择。我们的分析基于广泛认可的数据集，包括BBBP、Tox21、PubChem、USPTO和ChEBI，有助于在实际化学背景下广泛探索LLMs的能力。作者评估了三个GPT模型（GPT-4、GPT-3.5和Davinci-003）在每个化学任务中以零样本和少样本上下文学习设置下的性能。作者的研究的主要结果是：1）在三个评估模型中，GPT-4的性能优于其他两个模型；2）在需要精确理解分子SMILES表示的任务（如反应预测和逆合成）中，GPT模型表现出较弱的竞争性能；3）GPT模型在与文本相关的解释任务（如分子描述）中展示出强大的能力；4）在可转化为分类或排序任务的化学问题（如属性预测和收率预测）中，GPT模型展现出与经典机器学习模型相当或更好的性能。

01

开源化学信息学工具包(Open Access Cheminformatics Toolkits)

CDK是结构化学信息学和生物信息学的开源Java库。该项目由Christoph Steinbeck，Egon Willighagen与Jmol和JChemPaint的开发人员Dan Gezelter于2000年发起。迄今为止，它是在科学界广泛支持下开展的最活跃的开源化学信息学项目之一。

03

ChemDataExtractor:从PDF、HTM、文本等中提取化学数据

ChemDataExtractor是一种从科学文档中自动提取化学信息的工具。给它一篇期刊文章，它将从文本中提取化学名称、属性和光谱，以便将它们导入数据库或电子表格。

03

ChemDataExtractor:从PDF、HTM、文本等中提取化学数据

ChemDataExtractor是一种从科学文档中自动提取化学信息的工具。给它一篇期刊文章，它将从文本中提取化学名称、属性和光谱，以便将它们导入数据库或电子表格。

06

Wolfram | Alpha 之 15 种非数学领域的使用

本文译自 Wolfram 博客2020年2月20日的文章，作者：Zoe Goldenfeld —— Wolfram 商业分析师。

01

MSDS物质安全数据表第8节要求各国工作场所职业接触限值标准

MSDS (Material Safety Data Sheet)物质安全数据表，即化学品安全技术说明书，亦可译为化学品安全说明书或化学品安全数据说明书。是化学品生产商和进口商用来阐明化学品的理化特性（如PH值，闪点，易燃度，反应活性等）以及对使用者的健康（如致癌，致畸等）可能产生的危害的一份文件。

04

Material Safety Data Sheet材料安全数据表

MSDS是 Material Safety Data Sheet 英文单词首字母的缩写，直译为材料安全数据表，通常被理解为材料安全说明书。主要是通过这份文件向货运公司，使用者等接触产品的相关方说明产品有哪些危险或危害，接触过程中需要注意什么，要做好哪些防护等，随着经济发展货物流通不断加大和人们安全意识的不断提高，MSDS这样的说明资料已经被普遍要求，由于MSDS早出现在欧美等发达国家，现在对MSDS的需要还都主要集中在相关出口产品上。

05

Elsevier的Greg Landrum访谈 | 成功的开源化学信息软(RDKit)的要素是什么？

RDKit是化学信息学和机器学习软件的集合，正在协助解决化学信息的难题。RDKit的创始人和创建者Greg Landrum在Elsevier的推动下接受了UDM（统一数据模型）团队的采访，分享了他的经验，即成功之路是怎样的，一个开源项目要想成功需要具备哪些要素。采访中所学到的知识将有助于塑造统一数据模型项目的未来，该项目正在从财团主导的Pistoia联盟模式向社区主导的模式转变。

05

Brief. Bioinform. | 从直觉到人工智能：药物发现中的小分子表征演变

今天介绍一篇2023年11月发表在《Briefings in Bioinformatics》期刊上的论文，题为“From Intuition to AI: Evolution of Small Molecule Representations in Drug Discovery”，文章的第一作者为英国爱丁堡大学的Miles McGibbon研究员和 Steven Shave研究员，以及中南大学的董界副教授，通讯作者为爱丁堡大学的Vincent Blay博士。该综述总结了药物发现领域中分子表示（表征）的演变历程，从最初的人类可读格式，逐步发展到现代的数字描述符、指纹，以及基于序列和图的学习表示。作者强调了各种表示方法在通用性、计算成本、不可逆性和可解释性等方面的优缺点。文章还讨论了药物发现领域的创新机会，包括为高价值、低数据制度创建分子表示，提炼更广泛的生物和化学知识成为新颖的学习表示，以及对新兴治疗方式进行建模。总体而言，文章聚焦于数字化分子表示在药物研发中的关键作用，同时探讨了所面临的挑战和机遇。

01

Material Safety Data Sheet物质安全数据表MSDS怎么办理哪里做最好？

MSDS (Material Safety Data Sheet)即化学品安全技术说明书，也可以称为物质安全数据表。物质安全数据表（MSDS）Material Safety Data Sheet是一份文件，其中包含有关潜在危害（健康，火灾，反应性和环境）以及如何安全地使用化学产品的信息；这是制定完整的健康和安全计划的重要起点，它还包含有关材料危害的使用，存储，处理和应急程序的信息，MSDS包含有关材料的更多信息，而不是标签。

02

Rdkit与Pandas连用处理CSV文件

文件名structure_links.csv，CSV格式，逗号分割，下载自drugbank

02

SMILES & InChI | 化学结构的线性表示法

可以将一个分子视为一个以原子为节点，结合为边的图。图形可以表示一个原子如何连接到另一个原子。如果已知原子之间的键数，则可以在以后添加氢原子，因此在计算机上表示分子时通常会省略氢原子。

07

本体论的实际应用: 来自科学前沿的故事

█ 本文译自 Stephen Wolfram 2017年7月19日的博客文章：The Practical Business of Ontology: A Tale from the Front Lines 化学与哲学 "我们正面临一项抉择，把化学品当作一座城市，还是一个数字？" 昨天我花了一整天时间设计 Wolfram 语言的新功能，就像过去30年的每一天一样。昨天下午的一场快节奏会议中我们讨论了如何扩展 Wolfram 语言在化学领域的功能。我们所讨论的问题在某种程度上具有典型的实用性。但事实证明

05

J. Chem. Inf. Model. | 基于Transformer的分子生成模型用于抗病毒药物设计

由于简化分子输入线入系统（SMILES）面向分子的原子级表示，并且在人类可读性和可编辑性方面不友好，然而，IUPAC是最接近自然语言的，并且在人类可读性和分子编辑方面非常友好，我们可以操作IUPAC来生成相应的新分子并产生适合编程的SMILES形式的分子。此外，抗病毒药物设计，特别是基于类似物的药物设计，更适合直接从IUPAC的功能团水平进行编辑和设计，而不是从SMILES的原子级水平进行设计，因为设计类似物仅涉及改变R基团，更接近化学家基于知识的分子设计。在此，我们提出了一种新颖的数据驱动的自监督预训练生成模型，称为“TransAntivirus”，以进行选择性替换编辑，并将有机分子转化为设计抗病毒候选类似物的所需性质。

05

DGL & RDKit | 基于GCN的多任务分类模型

纽约大学、纽约大学上海分校、AWS上海研究院以及AWS MXNet Science Team共同开源了一个面向图神经网络及图机器学习的全新框架，命名为Deep Graph Library（DGL）。

06

AI医疗高精尖！基于AI的新药研发！⛵

人工智能作为一种新兴技术，是新药研发实现降本增效的重要方式之一，『人工智能+新药研发』成为国内外医药企业加速创新转型的重要驱动力，一个更快、更便宜、更有效的新药物研发时代已经到来。

08

Milvus 赋能 AI 药物研发

新药研发领域长期以来都以耗时长、成本高、风险大、回报率低而著称，一款新药的平均研发成本已经高达 26 亿美元，而平均耗时需要十年。尽管付出了如此高昂的研发成本和漫长的研发周期，却依然无法保证所研发的药物能够顺利通过全部临床实验而投放市场。即便是难度较低的仿制药研发，其研发的进程也是十分缓慢。

01

RDKit相关文章汇总

RDKit在2000-2006年期间在Rational Discovery开发和使用，用于构建吸收、分布、代谢、代谢、毒性和生物活性的预测模型。2006年6月Rational Discovery被关闭，但该工具包在BSD许可证下作为开源发布。目前，RDKit的开源开发由诺华积极贡献，其中包括诺华捐赠的源代码。

04

JCIM｜VenomPred2.0：基于AI的药物分子毒性预测工具

人工智能和机器学习方法在计算毒理学和药物设计中的应用越来越受欢迎，这一方法在评估化合物安全性、优化ADMET以及满足3R原则（the rules of 3R）等领域被认为非常具有前景。

01

Rdkit学习-No.5-使用SMARTS根据已有的化学反应生成新分子

from rdkit.Chem.AllChem import ReactionFromSmarts

02

Rdkit学习-No.1-安装与使用

RDkit的安装与使用简介 RDkit著名的开源化学信息学工具之一，基于BSD协议，核心数据结构与算法由C++编写。支持Python2与Python3，支持KNIME，支持机器学习方面的分子描述符的产生。安装 1:Conda模式官方建议使用Conda进行安装与管理，Conda可以使用清华的源进行下载，安装完成后，再次更换其安装源，同样更换为清华的源。换源的教程参考安装命令： conda install rdkit 2：Pycharm模式 Pycharm并不能直接安装RDkit，当使用上一步Conda

02

SCI写作专题第三期：Materials and Methods

Scientific writing的主要任务是将研究者的信息清晰、简明地传达给科学界，一是为了科学论文的发表，二是推动了科学和循证决策的进展，在过去的几十年里，形成了科学写作的统一结构和风格，Materials and Methods也一样，需要追求：准确和详细。

04

生物信息中的Python 02 | 用biopython解析序列

上一篇文章生物信息中的Python 01 | 从零开始处理基因序列自己造轮子实现了序列的基础操作，但是在Python的世界里，一项工作只要重复的次数多了，那么一定就会有大神来开发相应的包来解决，这个包名就是 Biopython 。接下来我们试着使用它来实现简单的序列处理。

01

基于RDKit的Python脚本：SDF格式转SMILES格式

简化分子线性输入规范（SMILES）是一种用ASCII字符串明确描述分子结构的规范，由David Weininger和Arthur Weininger于20世纪80年代晚期开发，并由其他人，尤其是日光化学信息系统有限公司修改和扩展。

03

RDKit | 化学信息学与AI(专辑)

介绍RDKit相关知识点和运用以及RDKit作为处理化学、生物、药学和材料学科中分子数据作为可输入机器学习和深度学习模型的重要工具应用。内容涵盖了基于RDKit的Python3的分子的读写、化合物的分子指纹和分子描述符计算、化合物的2D/2D比对、化合物相似性搜索、化合物骨架分析和亚结构搜索、RMSD计算与构象生成优化、分子相似图与聚类分析、化学反应处理、可视化与化学空间探索及RDkit相关的机器学习、深度学习应用过程详解

06

Python家族全家福，看你到底有多少熟人？

包管理管理包和依赖的工具。 pip – Python 包和依赖关系管理工具。 pip-tools – 保证 Python 包依赖关系更新的一组工具。 conda – 跨平台，Python 二进制包管理工具。 Curdling – 管理 Python 包的命令行工具。 wheel – Python 分发的新标准，意在取代 eggs。文本处理用于解析和操作文本的库。通用 chardet – 字符编码检测器，兼容 Python2 和 Python3。 difflib – (Python 标准库)帮助我们进

05

用 Python 玩转常用生物序列

比如查看 POU5F1 基因：https://www.ncbi.nlm.nih.gov/gene/5460

03

RDKit | 通过评估合成难度筛选化合物

无论如何获得先导化合物，评估候选先导化合物的合成难度都很重要。无论该化合物在计算机上的应用前景如何，实际上并未对其进行合成和评估。

04

吐血总结！100个Python面试问题集锦

Python是目前编程领域最受欢迎的语言。在本文中，我将总结Python面试中最常见的100个问题。每道题都提供参考答案，希望能够帮助你在2019年求职面试中脱颖而出，找到一份高薪工作。这100道面试题涉及Python基础知识、Python编程、数据分析以及Python函数库等多个方面。

02

吐血总结！50道Python面试题集锦（附答案）「建议收藏」

Python是目前编程领域最受欢迎的语言。在本文中，我将总结Python面试中最常见的50个问题。每道题都提供参考答案，希望能够帮助你在2019年求职面试中脱颖而出，找到一份高薪工作。这些面试题涉及Python基础知识、Python编程、数据分析以及Python函数库等多个方面。

01

python面试题目及答案(数据库常见面试题及答案)

Python是目前编程领域最受欢迎的语言。在本文中，我将总结Python面试中最常见的50个问题。每道题都提供参考答案，希望能够帮助你在2019年求职面试中脱颖而出，找到一份高薪工作。这些面试题涉及Python基础知识、Python编程、数据分析以及Python函数库等多个方面。

02

DGL-LifeSci：面向化学和生物领域的 GNN 算法库

尝试使用新的DGL--LifeSci并建立Attentive FP模型并可视化其预测结果。

04

DGL & RDKit | 基于Attentive FP的分子性质线性模型

2019年8月13日JMC（Journal of Medicinal Chemistry）刊登了一篇文章“Pushing the Boundaries of Molecular Representation for Drug Discovery with the Graph Attention Mechanism”，介绍了一种基于注意力机制的图神经网络模型（Attentive FP）。该模型可以用于分子表征，在多个药物发现相关的数据集上的预测表现达到当前最优，并且该模型所学到的内容具有可解释性。

05

Nucleic Acids Research | PROTAC-DB：PROTACs在线数据库

今天给大家介绍的是浙江大学侯廷军教授团队发表在Nucleic Acids Research上的一篇文章“PROTAC-DB：an online database of PROTACs”。蛋白水解靶向嵌合体(PROTACs)是一种通过泛素-蛋白酶体系统选择性降解靶蛋白的新型治疗技术，具有传统抑制策略无法比拟的优势。目前PROTAC的设计仍然是一个巨大的挑战，为了对PROTACs进行合理设计，本文提出了一个基于Web的开放式数据库PROTAC-DB，它集成了PROTACs的结构信息和实验数据。目前，PROTAC-DB已经囊括了1662个PROTAC、202个弹头(靶向目标蛋白质的小分子)、65个E3配体(能够招募E3连接酶的小分子)和806个Linker以及它们的化学结构、生物活性和理化性质。其中，PROTAC-DB详细提供了弹头和E3配体的生物活性以及PROTAC的降解能力、结合亲和力和细胞活性。PROTAC-DB可以通过两种常用的搜索方法进行查询：基于文本的(靶点名称、化合物名称或ID)和基于结构的。

04

RDKit：化合物亚结构（Substructure）搜索

当一个化合物合成出来之后,化学工作者常常关心的是分子中某一部分(如功能团)的有关信息,因而,亚结构(substructure)检索,从某种角度上讲,对于化学工作者来说是最为重要的手段。

03

Python每日一谈｜No.33.实例.13. 药物分子可合成性分析-SA

反正，你要做药物，或者不管做什么，都需要顾及到各种各样的条件，我们总是在所处的条件环境下进行选择或者进行实验。

01

【小白必看】轻松获取王者荣耀英雄皮肤图片的Python爬虫程序

当谈到王者荣耀游戏时，无法忽视的是其丰富多样的英雄皮肤。这些皮肤不仅为玩家提供了个性化的游戏体验，还展示了设计师们的创造力和努力。然而，要手动下载每个英雄的皮肤图片是一项枯燥且费时的任务。幸运的是，我们可以利用编程的力量来自动化这一过程。本文将介绍如何使用Python编写一个简单的爬虫程序，通过访问英雄主页并解析HTML代码，来批量下载王者荣耀英雄的皮肤图片。

01

DGL | 基于深度学习框架DGL的分子图初探

纽约大学、纽约大学上海分校、AWS上海研究院以及AWS MXNet Science Team共同开源了一个面向图神经网络及图机器学习的全新框架，命名为Deep Graph Library（DGL）。

04

手把手教学构建农业知识图谱：农业领域的信息检索+智能问答，命名实体识别，关系抽取，实体关系查询

安装一系列pip依赖： cd至项目根目录，运行 sudo pip3 install -r requirement.txt

02

BIB |基于分而治之的分子图片识别深度学习框架

今天给大家介绍中南大学曹东升教授/国防科技大学吴城堃教授/浙江大学侯廷军教授团队共同在国际期刊Briefings in Bioinformatics上发表的分子图片识别的文章《ABC-Net: a divide-and-conquer based deep learning architecture for SMILES recognition from molecular images》。该文章基于分而治之的思想提出把分子识别问题转换为其组成元素的识别，包括分子键线与原子字符标识，然后使用关键点识别技术进行相关元素的识别并重新组装恢复分子结构。该方法在构造的数据集以及基准测试集上较以前的方法取得了显著的提升。

02

RDKit | 基于RDKit和SMARTS的化学反应处理

SMILES (Simplified Molecular Input Line Entry System)是一种分子描述语言，由Daylight C.I.S.的创始人 Dr. David Weininger 博士发明。它简单，易于理解，且广泛使用的分子描述方法。

04

创建独立的Python化学信息学环境

OpenBabel和RDKit作为常用的化学信息学工具很受青睐，为了防止和其他项目的冲突，将他们单独创建在同一个Python环境。

02

【新书推荐】《计算化学中的密度矩阵重正化群方法》

2022年8月，由南京大学马海波教授、德国慕尼黑大学Ulrich Schollwöck教授、清华大学/香港中文大学（深圳）帅志刚教授合作撰写的新书《Density Matrix Renormalization Group (DMRG)-based Approaches in Computational Chemistry》（计算化学中的密度矩阵重正化群方法）由荷兰爱思唯尔（Elsevier）出版社正式出版。

02

基于图卷积神经网络的分子距离矩阵预测

2022年2月3日，西南交通大学计算机与人工智能学院的林小惠/江永全*/杨燕等人在Journal of Molecular Structure杂志发表文章，提出了一种基于图卷积网络预测原子间两两距离的模型，以解决传统计算方法在确定分子结构时实验成本高、计算成本高的问题。

03

python-数据库编程-如何在Python中连接到数据库

在Python中，我们可以使用各种模块来连接到关系型数据库并进行操作，如MySQL、PostgreSQL、SQLite等。

03

聚类小分子数据集(基于RDKit的Python脚本)

聚类是一种有价值的化学信息学技术，用于将大型化合物数据集合细分为单个小组相似化合物。其中一个优点是处理非常大的小分子数据集时特别有用。通常用于分析高通量筛选结果、虚拟筛选或对接研究的分析。

07

【16】进大厂必须掌握的面试题-100个python面试

回答：解释语言是在运行时之前不在机器级别代码中的任何编程语言。因此，Python是一种解释型语言。

03

python 爬虫资源包汇总

做一个知识的索引网络通用 urllib -网络库(stdlib)。 requests -网络库。 grab – 网络库（基于pycurl）。 pycurl – 网络库（绑定libcurl）。 urllib3 – Python HTTP库，安全连接池、支持文件post、可用性高。 httplib2 – 网络库。 RoboBrowser – 一个简单的、极具Python风格的Python库，无需独立的浏览器即可浏览网页。 MechanicalSoup -一个与网站自动交互Python库。 mechaniz

03

图解python | 模块

教程地址：http://www.showmeai.tech/tutorials/56

05

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭