我想用python的rdkit从微笑中提取分子。我使用的微笑是从drugbank下载的。
然而,当我使用函数Chem.MolFromSmiles时,有些微笑会报告,而有些则不会:Explicit valence for atom # 0 N, 4, is greater than permitted。
我找到了一些关于这个问题的解释:这是因为微笑产生了一个在现实世界中不存在的无效分子。但我不是化学学生..。有谁知道怎么解决这个问题吗?
我试着用RDKIT获得微笑化学相似性。我的dataframe "subs_df“包含两个列,其中一个列包含微笑数据。
import time
import random
import sys
from pathlib import Path
import seaborn as sns
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from rdkit import Chem
from rdkit import DataStructs
from rdkit.ML.Cluster import
我正在用rdkit计算两个鼹鼠之间的结构相似曲线。当我在google (rdkit=2020.09.2 python=3.7)中运行该程序时,程序运行得很好。
当我在PC (rdkit=2021.03.2 python=3.8.5)上运行时,我得到了一个错误。这个错误有点奇怪。dataframe包含500行,代码只对前10行(0-9)起作用,对于后面的行,我得到了一个错误。
s = DataStructs.BulkTanimotoSimilarity(fps_2[n], fps_2[n+1:])
ValueError: BitVects must be same length
下面
我使用的是rdkit,这是一个化学信息学工具包,它提供了一个postgresql盒来存储化学分子。我想创建一个django模型,如下所示:
from rdkit.Chem import Mol
class compound(models.Model):
internal = models.CharField(max_length=10 ,db_index=True)
external = models.CharField(max_length=15,db_index=True)
smiles = models.TextField()
# This is m
我在尝试检索以下页面上的一种化学品的IUPAC名称时遇到问题:
在本例中,我只是希望打印结果返回为Benzene。
下面的代码使用className `拉取所有元素
Public Sub GetContents()
Dim XMLReq As New MSXML2.XMLHTTP60
Dim HTMLDoc As New MSHTML.HTMLDocument
XMLReq.Open "Get", "https://echa.europa.eu/brief-profile/-/briefprofile/100.000.685
这个想成为生物信息学家的人需要你的帮助。下面的代码使用rdkit查找化合物典型微笑的相似性。经过一些研究,我知道它一定是O(n)!(或者不是?)因为对于944个条目的小文件,它花费了20分钟,而对于330.000个条目的最大文件,已经运行了30多个小时。现在,我发现它的一个问题是,它不只比较元素一次,所以这是一个因素,减慢了它的速度。我在这里读到,您可以使用itertools库快速进行比较,但通常情况下,如何才能使此代码更好?在我尝试学习的过程中,任何帮助都将不胜感激:)
from rdkit import Chem
from rdkit import DataStructs
from rdk
我想在Jupyter环境中使用RDKit。然而,在我遵循了this document中概述的过程之后。 在完成这个过程之后,包括获取jupyter的内核,我尝试访问RDKit并使用它。 (rdkit-test) [user] ~ $ python
Python 3.7.9 (default, Aug 31 2020, 07:22:35)
[Clang 10.0.0 ] :: Anaconda, Inc. on darwin
Type "help", "copyright", "credits" or "license" for
我一直在通过jupyter笔记本使用VS代码。所以,我必须生成由15个分子组成的网格图像,并将其保存到我的计算机上,但我一直使用的脚本没有显示任何错误,但仍然没有生成任何图像,也没有将它们保存到我的计算机指定的文件中,即使电池气体已经成功执行。
我是新的和新的世界计算化学,并将感谢任何帮助!
我的剧本在下面。
from rdkit import Chem
from rdkit.Chem import Draw
from rdkit.Chem.Draw import MolsToGridImage
from rdkit.Chem import SDMolSupplier
suppl = Che
当我尝试的时候,
from Bio.Alphabet import IUPAC
from Bio import Seq
my_prot = Seq("AGTACACTGGT", IUPAC.protein)
为什么我会遇到以下错误:
TypeError: 'module' object is not callable
PS:这是来自BioPython's Cookbook的一个例子