官网: web:https://www.drugbank.com/ 简介: DrugBank是一个精选的药品知识库,其产品可在市场上购买,用于精准医学,远程医疗和药物发现。...#### 教程: web : https://dev.drugbank.com/guides/tutorials/index ?...inplace=True, errors='raise') #重命名列名 for i in df.columns: df.rename(columns={i:i.replace('{http://www.drugbank.ca...}','')},inplace=True) #输出为csv df.to_csv('drugbank.csv',index=False) ```
DrugBank XML解析 ---- 官方网站: https://www.drugbank.ca 最近好像很多人在关注这个网站,就暂时开一个 官网就是这个样子 ?...---- 下载以及分析 想当初我还曾经用爬虫爬过drugbank的信息,现在想想真的是傻 下载链接: https://www.drugbank.ca/releases/latest 下载界面: ?...schemaLocation="http://www.drugbank.ca http://www.drugbank.ca/docs/drugbank.xsd" version="5.1" exported-on...="true">DB00001 BTD00024 BIOD00024</drugbank-id...}drugbank-id DB00002 {http://www.drugbank.ca}drugbank-id BTD00071 {http://www.drugbank.ca}drugbank-id
DrugBank:小分子数据信息挖掘 如题:仅供参考 #导入依赖包 #!...AllChem from rdkit import DataStructs from rdkit.Chem import Draw import pandas as pd #载入数据 #获取数据集中第一个分子 drugbank...= Chem.SDMolSupplier('structures.sdf') drugbank[0] #获取数据集中第一个分子名称 drugbank[0].GetProp('GENERIC_NAME'...approved = [] for drug in drugbank: if drug and 'approved' in drug.GetProp('DRUG_GROUPS'):...计算数据集中第一个分子的MACC分子指纹 #基于MACC指纹相似性的比对,获得Tanimoto系数 bivalirudin_fp = AllChem.GetMACCSKeysFingerprint(drugbank
DrugBank数据库简介 DrugBank数据库是唯一将详细的药品数据(即化学、药理学和制药)与综合药物靶点信息(即序列、结构和作用通路)相结合的“生物信息学和化学信息学”资源。...DrugBank数据库功能 开发DrugBank数据库旨在缩小临床药品资源和化学药品数据库之间“深度与广度”的差距。...作为临床导向的药品百科全书,DrugBank能够提供关于药品,药品靶点和药物作用的生物或生理结果的详细、最新、定量分析或分子量的信息。...作为化学导向的药品数据库,DrugBank能够提供许多内置的工具,用于查看、排序、搜索和提取文本、图像、序列或结构数据。...DrugBank数据库小分子信息的解析,药物结构提取: 下载XML文件 https://www.drugbank.ca/releases/latest ?
cascade") cursor.execute("create schema drugbank") cursor.execute(""" create table drugbank.drugbank...hbd integer, mw float, logp float ); """) cursor.execute("select * from drugbank.drugbank...") print(cursor.fetchall()) supp = Chem.SDMolSupplier("drugbank.sdf") drugbank = [mol for mol in supp...if mol] query = "insert into drugbank.drugbank (smiles, drugbank_id) values %s" % ((', '.join(["('...(), len(drugbank)) cursor.execute("select * from drugbank.drugbank limit 10") print(cursor.fetchall
DrugBank DrugBank数据库是唯一将详细的药品数据(即化学,药理学和制药)与综合药物靶点信息(即序列,结构和作用通路)相结合的“生物信息学和化学信息学”资源.DrugBank由加拿大卫生研究院...,亚伯达省创新 - 健康解决方案和代谢组学创新中心(TMIC)提供支持,该中心是国家资助的研究以及支持广泛的尖端技术代谢组学研究的核心.DrugBank数据库查询包含以下信息:药品类型,药品简介,化学结构...DrugBank数据库是药物和候选药物及其靶标的在线数据库,截至2020年2月的最新版本是2020年1月3日发布的5.1.5版。所有13490条目的明细如下所示。...分类 条目数 所有条目 13490 小分子药物 2636 生物制药 1365 功能食品 131 搜索阶段化合物 > 6350 数据集下载 DrugBank数据库中选择Structure下的ALL(3D...): https://www.drugbank.ca/releases/latest#structures ?
= Chem.SDMolSupplier('drugbank.sdf') drugbank = [m for m in drugbank_input if m] 骨架提取示例 basic_structure...= [MurckoScaffold.GetScaffoldForMol(mol) for mol in drugbank] for i in drugbank_atomic_scaffolds:...= [genericize_scaffold(s) for s in drugbank_atomic_scaffolds] len(drugbank), len(drugbank_atomic_scaffolds...), len(drugbank_grafh_scaffolds), len([x for x in drugbank_grafh_scaffolds if x == None]) Draw.MolsToGridImage...([drugbank[111], drugbank_atomic_scaffolds[111], drugbank_grafh_scaffolds[111]]) 骨架出现频率统计 scaffold_smiles
源文件: 文件名structure_links.csv,CSV格式,逗号分割,下载自drugbank 文件名structures.sdf,sdf格式,下载自:drugbank 现在开始实现步骤: In...importIPythonConsole #pandas读取数据,读取csv数据 In[2]:df =pd.read_csv('structure_links.csv') In[3]:df.columns Out[3]: Index(['DrugBank...In[4]:PandasTools.AddMoleculeColumnToFrame(df,smilesCol='SMILES') In[5]:df.columns Out[5]: Index(['DrugBank...: Index(['ALOGPS_LOGP', 'ALOGPS_LOGS', 'ALOGPS_SOLUBILITY', 'DATABASE_ID', 'DATABASE_NAME', 'DRUGBANK_ID
表 1 表 2 表1和表2分别展示了在DrugBank和ChEMBL数据上对于药物到适应症任务的MolT5实验结果。在每次实验的所有指标上,较大的模型往往表现更好。...在DrugBank和ChEMBL数据集上,几乎所有指标对于药物到适应症任务而言,模型在20%子集数据上表现最佳。同时,子集和完整数据集的评估都比微调实验的结果更好。...模型在DrugBank数据上的表现优于ChEMBL数据,这可能是由于DrugBank提供的药物适应症的详细程度造成的。...表 3 表 4 表3和表4分别展示了在DrugBank和ChEMBL数据上对于适应症到药物任务的MolT5实验结果。表格显示,在新数据上微调模型会恶化性能。...在药物到适应症任务中,特别是在DrugBank数据集上,模型表现出了较好的适应性和性能提升的可能性。
首先,DrugBank是一个可靠的数据源,对DDIs的描述具有统一的语法,因此我们可以通过标准描述提取DDI事件并进行进一步的研究。第二,药库具有多种药物特征。...2 数据集 DrugBank是一个能提供12151种药物的综合信息的资源,包括3,844种FDA批准的药物和5867种实验药物。...在这项研究中,作者从DrugBank中收集了DDIs以及药物的四个特征:化学子结构、靶标、通道和酶。...在我们从DrugBank获得一种药物的通道(KEGG ID)后,我们可以使用KEGG数据库将KEGG ID转换为相应的药物通路信息。药物的靶标和酶直接从数据库中获取。...4.5案例研究 作者使用来自DrugBank的数据集中的所有DDIs和它们的事件来训练预测模型,然后对其他药物-药物对进行预测。
2.2 建立药物-靶标网络 从6种常用数据(DrugBank、PharmGKB、ChEMBL、TTD、BindingDB、IUPHAR/BPS)收集了FDA批准或临床研究药物的高质量药物-靶标相互作用,...每种药物的化合物名称由MeSH和UMLS词汇表标准化,并进一步从DrugBank数据库转换为DrugBank ID,删除重复的药物对。...2.4 收集不良的药物-药物相互作用 汇编了来自DrugBank数据库的临床报告的药物不良反应(DDIs)数据。这里专注于药物相互作用,其中每种药物都有经过实验验证的靶标信息。...每种药物的化合物名称由MeSH和UMLS词汇表标准化,并进一步从DrugBank数据库转换至DrugBank ID 。...本研究中使用的所有FDA批准药物的ATC代码均从DrugBank数据库下载。药物A和B的第k级药物临床相似性(Sk)通过如下的ATC代码定义。 ?
3.结果 3.1 评估策略 作者在Yamanishi_08和DrugBank_FDA两个数据集上对模型进行训练并与当前最新模型进行对比。...3.2 与其他模型的对比 在Yamanishi_08和DrugBank_FDA数据集上对模型进行测试,并将实验结果与各种模型进行比较。图2为所有模型的AUC-ROC和AUC-PR得分的总体比较结果。...图2 TriModel模型与其他最新模型的AUC-ROC和AUC-PR值的对比图所有制使用百分比(%)表示, DB代DrugBank_FDA数据集 3.3局限性 TriModel模型适合于在已经充分研究的药物和靶标之间找到新的关联...通过使用如KEGG、UniProt和DrugBank等现有的生物知识库生成了与药物-靶标相关的生物实体知识图谱。然后,训练TriModel模型来学习药物-靶标的有效向量表示。
ZINC数据集的变体数据集,增加了DrugBank数据库中的分子,称为ZINC+DrugBank。 两个数据集中随机选择了部分分子进行可视化,见图4。两个数据集均经过三步处理: 1....图4 从ZINC(A)和DrugBank(B)中随机选择的分子的2D图可视化。使用RDKit进行可视化。...在ZINC+DrugBank数据集上训练,进行FragVAE+DEL实验; 3. 在ZINC数据集上训练,进行JTVAE+DEL实验; 4....在ZINC+DrugBank数据集上训练,进行JTVAE+DEL实验。...分别从基于ZINC和ZINC+DrugBank数据上训练的FragVAE+DEL中检索到89和99个分子;图7、8所示的ZINC和ZINC+DrugBank数据集上预测的结果,对JTVAE+DEL的94
本文使用 Adam SGD 优化器,并在 DrugBank 上使用 200 个 epoch 和在 Twosides 上使用 120 个 epoch 训练模型。...实验 2.1 现有药物换能器设置的性能评估 本文在两个标准基准上进行了实验:DrugBank 和 Twosides,以评估本文的算法 DSN-DDI 的性能。...此外,下表分别比较了 DrugBank 训练集和测试集的预测精度值,表现一致表明本文训练模型时没有过拟合。...及其五个变体在 DrugBank 数据集上的性能评估 DSN-DDI 及其五个变体在 DrugBank 数据集上归纳设置的性能评估 双侧数据集上 DSN-DDI 及其五种变体的归纳设置性能评价 完整的...本文收集了 DrugBank 数据集中所有药物的 FDA 药品批准信息,并根据 2017 年之前或之后的药品批准日期将其分为两部分。
DRKG包括来自六个现有数据库的信息,包括DrugBank、Hetionet、GNBR、String、IntAct 、DGIdb,以及从最近的出版物收集的数据,特别是与Covid19相关的数据。...3.2 DrugBank https://www.drugbank.ca/ ? 3.3 String ? 4....”关系的药物筛查 2、基“基因-化合物”关系的药物筛查 6.4.1 基于“疾病-化合物”关系的药物筛查 首先,收集DRKG中所有冠状病毒(COV)疾病,映射到对应的图谱实体(疾病)嵌入向量; 其次,在Drugbank...6.4.2 基于”基因-化合物“的药物筛查 首先,收集DRKG中所有冠状病毒(COV)相关基因,映射到对应的图谱实体(基因)嵌入向量; 其次,在Drugbank中使用FDA批准的药物作为候选药物,约有8104
作者从DrugBank数据库中得到了4种feature和65类DDI事件,并提出了一个叫做DDIMDL的多模态深度学习框架用以组合这四种feature并通过深度学习方法预测DDI。...作者重点研究了DrugBank中已知DDI的描述,并通过对这些描述进行语义分析,构建了一个DDI事件数据集。...二、模型与方法 2.1 数据集 DrugBank是一个药物数据库,其提供有关12151种药物的综合信息,包括3844种FDA批准的药物和5867种实验药物。...DrugBank中的DDI通常用结构固定的句子描述。...不同方法在三类任务上的表现 3.5 案例研究 作者使用来自DrugBank的所有DDI及其事件来训练预测模型,然后对其他药物对进行预测。
利用大型数据库中已有的CPI和DTI(例如ChEMBL和BindingDB的CPI,以及DrugBank中已知的DTI)证明了DeepCPI的出色预测性能。...实验结果 3.1 DeepCPI实验方案 作者引用其他文章(https://academic.oup.com/nar/article/34/suppl_1/ D668/1132926)的ChEMBL和DrugBank...AUROC和AUPRC评估 3.3 DeepCPI预测DTI效果 从DrugBank 获得的所有已知DTI数据都用于训练DeepCPI,然后检查在DrugBank中没有建立相互作用记录的药物-靶对的新预测结果...(紫色和黄色圆圈分别代表目标和药物,灰线表示从DrugBank派生的已知相互作用,红色虚线表示使用DeepCPI预测的新颖相互作用。) ? 图3.
图1 deepDTnet的工作流程图 2.1构建异构网络 药物-靶标网络 药物-靶标关联信息来自数据库DrugBank(v4.3)、Therapeutic Target Database(TDD)和PharmGKB...药物相互作用(DDI) 每种药物的化学名称、通用名称或商业名称均通过医学主题词(MeSH)和统一医学语言系统(UMLS)词汇进行了标准化,然后从DrugBank数据库(v4.3)进一步转移至DrugBank...药物-疾病网络 作者从多个公共数据库(repoDB、DrugBank(v4.3)和DrugCentral)中收集了已知的药物适应症(药物-疾病关联)。...药物对的化学相似性分析 作者从DrugBank数据库下载了化学结构信息(SMILES格式),并使用Open Babel(v2.3.1.100)计算每种药物的MACCS指纹。...药物对的临床相似性分析 本研究中使用的所有FDA批准药物的药物解剖学化学(ATC)代码均从DrugBank数据库(v4)下载。药品A和B的第k级药品临床相似性(Sk)定义如下: ?
本文使用 Adam SGD 优化器,并在 DrugBank 上使用200个 epoch 和在 Twosides 上使用120个 epoch 训练模型。...现有药物换能器设置的性能评估 本文在两个标准基准上进行了实验:DrugBank 和 Twosides,以评估本文的算法 DSN-DDI 的性能。...此外,下表分别比较了 DrugBank 训练集和测试集的预测精度值,表现一致表明本文训练模型时没有过拟合。 2....及其五个变体在 DrugBank 数据集上的性能评估 DSN-DDI 及其五个变体在 DrugBank 数据集上归纳设置的性能评估 双侧数据集上 DSN-DDI 及其五种变体的归纳设置性能评价 完整的...本文收集了 DrugBank 数据集中所有药物的 FDA 药品批准信息,并根据2017年之前或之后的药品批准日期将其分为两部分。
工具 7、DrugBank介绍与使用 DrugBank数据库是阿尔伯塔大学提供的一个生物信息学和化学信息学数据库,是一种独特的生物信息学和化学信息学资源,它将详细的药物数据和全面的药物目标信息结合起来...最近发布的DrugBank包含超过50条和药物相关条目,其中包括2723种经批准的小分子药物、1540种经批准的生物技术(蛋白质/肽)药物、131种营养品和6451种实验药物。...工具链接:https://go.drugbank.com/ 8、easyalluvial - 绘制冲积图的R包[5] easyalluvial是快速绘制冲积图(Alluvial diagram)的R包
领取专属 10元无门槛券
手把手带您无忧上云