专栏首页FindKey使用Rdkit对SDF文件进行分割

使用Rdkit对SDF文件进行分割

import rdkit
from rdkit import Chem
suppl = Chem.SDMolSupplier('enamine_3d.sdf')
count = len(suppl)
2102303
# out_sdf输出为sdf文件
def out_sdf(lig_list,filename):
    writer = Chem.SDWriter(filename)
    for i in lig_list:
        writer.write(i)
    writer.close()
    return
# 将SDF分割为10000为单位的小块
cut = 10000
for i in range(len(suppl)):
    tmp = []
    while len(tmp) < cut:
        try:
            tmp.append(next(suppl))
        except StopIteration:
            break
  out_sdf(tmp,str(i)+'.sdf')

本文分享自微信公众号 - FindKey(DrugNote),作者:ZeroDesigner

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2021-08-03

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Rdkit与Pandas连用处理CSV文件

    文件名structure_links.csv,CSV格式,逗号分割,下载自drugbank

    FindKey
  • RDKit相关文章汇总

    RDKit在2000-2006年期间在Rational Discovery开发和使用,用于构建吸收、分布、代谢、代谢、毒性和生物活性的预测模型。2006年6月R...

    DrugAI
  • Rdkit学习-No.1-安装与使用

    FindKey
  • 基于RDKit的Python脚本:SDF格式转SMILES格式

    简化分子线性输入规范(SMILES)是一种用ASCII字符串明确描述分子结构的规范,由David Weininger和Arthur Weininger于20世纪...

    DrugAI
  • FindKey-CADD-交流群-半月结-No.1-2021.03.31

    A:1,rdkit+Knime;2,随便一个文本编辑器,打开,编辑就可以,用记事本打开 剪切出来-再粘贴到新文件就好了

    FindKey
  • RDKit | 化合物库的相似性分析

    实例中使用SMILES文件,该分析可以以相同的方式从分子的SDF或其他格式文件中加载数据,只需确保使用适当的方法将分子加载到RDKit中。

    DrugAI
  • 开源化学信息学工具包(Open Access Cheminformatics Toolkits)

    CDK是结构化学信息学和生物信息学的开源Java库。 该项目由Christoph Steinbeck,Egon Willighagen与Jmol和JChemPa...

    DrugAI
  • RDKit | 化学信息学与AI(专辑)

    介绍RDKit相关知识点和运用以及RDKit作为处理化学、生物、药学和材料学科中分子数据作为可输入机器学习和深度学习模型的重要工具应用。内容涵盖了基于RDKit...

    DrugAI
  • Conformator使用—小分子构象生成工具

    计算机辅助药物设计方法,例如:对接,药效团搜索,3D数据库搜索以及3D-QSAR模型的创建,需要构象集合来处理小分子的灵活性。Conformator,这是一种基...

    FindKey
  • DGL & RDKit | 基于GCN的多任务分类模型

    纽约大学、纽约大学上海分校、AWS上海研究院以及AWS MXNet Science Team共同开源了一个面向图神经网络及图机器学习的全新框架,命名为Deep ...

    DrugAI
  • 基于神经网络的溶解度预测和回归分析

    人工智能是一个主题,尝试使用神经网络作为模型建立化合物物理性质的预测模型。机器学习库是由Google开发和使用的TensorFlow。Keras是一个使Tens...

    DrugAI
  • RDkit&mol2vec :靶标抑制剂活性二分类模型对比

    RDKit提供各种功能,如不同的化学I/O格式,包括SMILES/SMARTS,结构数据格式(SDF),Thor数据树(TDT),Sybyl线符号(SLN),C...

    DrugAI
  • PHP对大文件进行读取切割拆分

    近期在对项目日志进行分析时,发现日志文件较大,里面的文件行数也较多,使用编辑器进行打开或使用分析工具打开时较慢,于是将其拆分成多个小文件,便于对其进行分析、查看...

    小白程序猿
  • RDKit:化合物亚结构(Substructure)搜索

    当一个化合物合成出来之后,化学工作者常常关心的是分子中某一部分(如功能团)的有关信息,因而,亚结构(substructure)检索,从某种角度上讲,对于化学工作...

    DrugAI
  • 开源化学信息学库 :ScaffoldGraph

    ScaffoldGraph是一个开放源代码化学信息库,使用RDKit和NetworkX构建,用于生成和分析骨架网络和支架树。

    DrugAI
  • C++ OpenCV使用InRange对HSV颜色进行分割

    上一篇中我们学习了《OpenCV---HSV颜色空间介绍》,对HSV的颜色进行了一个简单的了解,这一章我们在研究一下利用颜色把想到的数据获取出来。OpenCV中...

    Vaccae
  • 使用OpenCV进行颜色分割

    在滤波、变换、缩放等任务中,图像分割具有重要的意义。图像分割是将不同的对象划分为不同的部分,并将这些区域以明显的颜色或者记号标记出来。图像分割是使用轮廓、边界框...

    AI算法与图像处理
  • 使用OpenCV进行颜色分割

    在滤波、变换、缩放等任务中,图像分割具有重要的意义。图像分割是将不同的对象划分为不同的部分,并将这些区域以明显的颜色或者记号标记出来。图像分割是使用轮廓、边界框...

    小白学视觉
  • 使用FreeSurfer进行脑区分割

    FreeSurfer 是美国哈佛-麻省理工卫生科学与技术部和马萨诸塞州总医院共同开发的一款磁共振数据处理软件包,是基于 Linux 平台的全免费开源软件。Fre...

    范中豪

扫码关注云+社区

领取腾讯云代金券