中国科学院深圳先进技术研究院罗小舟团队提出了,基于酶动力学参数预测框架 (UniKP),实现多种不同的酶动力学参数的预测。
Insilico Medicine公布生成化学设计的靶向2019年新型冠状病毒关键蛋白质酶的小分子结构
这次为大家报道的是Nature Communiations 上一篇题为”Merging enzymatic and synthetic chemistry with computational synthesis planning” 的文章,来自美国马萨诸塞州麻省理工学院的Connor W. Coley团队。
天然产物(Natural Products)是临床药物开发的主要来源,解析天然产物的生物合成途径是实现生物合成中最基础的一步。然而,目前超过90%的天然产物的生物合成途径仍然未知。中山大学药学院巫瑞波教授课题组与国家超算广州中心杨跃东教授课题组联合星药科技、美国麻省理工学院和佐治亚理工学院,依托“天河二号”开发了基于深度学习的天然产物生物合成途径导航器BioNavi-NP, 并在多个公开测试集中获得出色验证,是超算+AI开展科技创新的又一个实践。该研究对天然产物生源途径的发现,以及异源生物合成途径的重构具有重要意义。相关成果6月正式发表在国际知名期刊《Nature Communication》。
没有疫苗和任何已知有效治疗方法的2019-nCoV的出现给新型药物发现方法带来了紧迫感。最重要的2019-nCoV蛋白靶标之一是3C样蛋白酶,其晶体结构已知。近期的大部分努力都集中在重新利用已知临床批准药物的药物上,以及对分子库的分子进行虚拟筛选。Insilico Medicine于2020年1月28日决定利用其生成化学方法来设计2019-nCoV的新型抑制剂,进行合成和测试,并根据需要优化已发布的分子。
今天为大家介绍的是来自Sagar D. Khare团队的一篇论文。酶具有精确和选择性地读取、编写和编辑DNA的能力,已经彻底改变了生物化学科学和技术。如果能够获得类似的酶,用于有选择性地“编辑”蛋白质,将产生广泛的影响。
天然产物(Natural Products)是临床药物开发的主要来源,解析天然产物的生物合成途径是实现生物合成中最基础的一步。然而,目前超过90%的天然产物的生物合成途径仍然未知。星药科技联合中山大学药学院巫瑞波教授课题组、国家超算广州中心杨跃东教授课题组、美国麻省理工学院和佐治亚理工学院,基于此前化学逆合成反应智能预测研究,依托“天河二号”开发了基于深度学习的天然产物生物合成途径导航器BioNavi-NP, 并在多个公开测试集中获得出色验证,是AI+超算开展科技创新的又一个实践。该研究对天然产物生源途径的发现,以及异源生物合成途径的重构具有重要意义。相关成果6月正式发表在国际知名期刊《Nature Communications》。
具有药理活性的生物 “靶点” 一般指药物直接结合的那些蛋白质,比如酶、离子通道和受体或其他生物分子 (如 DNA、RNA、肝素和肽)。大多数药物靶点是蛋白质,用于治疗或诊断疾病的化学物质与靶标蛋白发生选择性相互作用,致使其生物途径或功能改变。
关于DNA的分子生物学试验是生物信息学研究的第一步,也是整个流程的基础,DNA质量的好坏直接关系到后续测序分析的成败。
生物体内的大多数反应都需要酶的参与,酶在生命活动中发挥了重要作用。IUBMB/UPAC 国际标准化命名委员会对已经发现的酶都提供了标准化的的命名方式,叫做EC number。
今天给大家介绍来自华中农业大学信息学院章文教授课题组在Bioinformatics上发表的一篇关于预测药物与药物相互作用事件的文章。作者提出了一个多模态深度学习框架— DDIMDL。它将不同的药物特征与深度学习相结合,建立了一个预测药物相互作用相关事件的模型。DDIMDL首先分别利用四种药物特征:化学子结构、靶点、酶和通道,构建基于深度神经网络的子模型,然后采用联合DNN框架组合子模型,学习药物-药物对的跨模态表征,预测药物与药物相互作用(DDI, drug–drug interactions )。
今天给大家介绍的是2020年1月在Drug Discovery Today上发表的综述“Frequent hitters: nuisance artifacts in high-throughput screening”。高通量筛选是药物研发的一个重要手段,然而研究中发现一些化合物在不同类型靶点筛选中均表现出阳性结果,这类化合物称为“频繁命中化合物”(Frequent hitters)。本综述针对频繁命中化合物的主要分类:胶体聚集化合物(Aggregators)、光学干扰物(Spectroscopic interference compounds)、化学易反应化合物(Chemical reactive compounds)和混乱成键化合物(Promiscuous compounds)进行简单介绍,同时对现常用的模型或规则和其未来发展方向进行讨论分析。
本次报道论文为发表于Nature Communications的Predicting base editing outcomes with an attention-based deep learning algorithm trained on high-throughput target library screens。该文章是苏黎世联邦理工学院的Kim F. Marquart等人的研究成果:在该项研究中,作者对包含 28,294 个慢病毒整合基因序列的文库进行了腺嘌呤和胞嘧啶碱基编辑器的广泛分析,并建立了 BE-DICT,这是一种基于注意力的深度学习算法,能够高精度地预测碱基编辑结果。
2021年9月29日,JCIM上发表了有关酶促反应模板提取和评分的文章:"EHreact: Extended Hasse Diagrams for the Extraction and Scoring of Enzymatic Reaction Templates"。
限制性内切酶,简称限内酶,是生物体内的可以将异源性DNA切断的一类酶,这可以限制异源DNA的侵入并使之失活,但对自身DNA没有损伤,可以维持细胞原有遗传信息的完整性。 限内酶可以是被DNA特异顺序序列即识别位点,并在识别位点内部或周围切割双链DNA。限内酶是分子克隆的基础。
后来发现居然有circDNA,感觉知识真的是无穷无尽,我是来不及学了,还有有朋友已经写了,就分享一下:
KEGG Reaction 是收录酶促反应相关信息的数据库,包含了所有代谢通路中的酶促反应和一些只在enzyme 数据库中有记录的酶促反应,每条记录用R Number 唯一标识。
福尔马林固定、石蜡包埋(FFPE) 的组织样本是世界各地病理实验室保存临床组织样本的标准方法。随着核酸测序技术的发展引起了人们对使用生物库中存储的历史FFPE样本的兴趣。然而,福尔马林固定会化学修饰DNA,这可能导致下游处理和数据分析中的错误。2023年6月,《Nucleic Acids Research》发表综述文章,回顾了 (I) 分析前样品质量控制、(II) DNA 修复处理、(III) 分析样品制备和 (IV) FFPE-DNA 生物信息学分析中的缓解策略,并提出建议。
研究还将启动所谓的拍字节(Petabytes)基因组学,1PB=1024TB,将对RNA和DNA进行数据分析。
大家好,本周为大家分享一篇发表在Science上的文章“Parallel molecular mechanisms for enzyme temperature adaptation”,文章通讯作者是斯坦福大学生物化学系的Daniel Herschlag教授和他的学生Margaux M. Pinney,他们实验室主要研究RNA和蛋白质的行为及其在生命活动中的影响。在本文中,他们结合深入机理研究以及对数千种酶的全面序列分析,对酶温度适应性的分子机理和进化机制进行了研究。
今天给大家介绍的文章来自瑞士洛桑联邦理工学院计算系统生物技术实验室,于2021年8月发表于elife期刊上。该论文开发了一个药物设计平台(数据库),收录了25万个具有生物活性的小分子,并研究了它们的代谢产物、代谢过程和毒性。该论文提出基于代谢物与活性位点相似性指纹的评分方法NICEDrug来评价抗癌药物5-氟尿嘧啶的抑制作用和毒性,并提出减轻副作用的途径。该论文还发现了shikimate 3-phosphate可用于治疗liver-stage疟疾。此外,NICEDrug提供了1300多种针对COVID-19的候选药物,并阐述了此类分子的抑制机制。
🔶报告基因/报告基团(reporter):是一种可被实验仪器非常方便检测到的化学基团、蛋白质或酶以及编码它们的基因。reporter可以通过实验手段非常容易被鉴定与检测,因此在实验中广泛应用。 例如,荧光素酶报告基因实验中运用的荧光素酶基因,以及qPCR中的荧光报告基团。 🤩报告基因是现代分子生物学研究领域中用于潜在的顺式元件和反式作用因子相互作用关系的一种重要工具,被广泛应用于基因表达调控、信号转导、启动子分析、受体功能鉴定、基因治疗以及药物筛选等领域。 ---- 一、荧光素酶报告基因实验(lucifer
编辑 | 绿萝 人工智能已经将蛋白质工程研究的时间缩短了数年。深度学习语言模型在各种生物技术应用中显示出前景,包括蛋白质设计和工程。 现在,来自 Salesforce Research、Tierra Biosciences 和加州大学的研究团队在实验室中合成了由 AI 模型预测的蛋白质,并发现它们与天然对应物一样有效。他们开发出一种名为 ProGen 的蛋白质工程深度学习语言模型。ProGen 接受了来自公开的已测序天然蛋白质数据库中的 2.8 亿个原始蛋白质序列的训练,从头开始生成人工蛋白质序列。最新方法
Reader :在自然界中,有一种可以嵌入到细胞膜中作为离子或分子通道的跨膜蛋白,具有天然的蛋白纳米孔。经过人为基因工程修饰后,得到的就是 Nanopore 测序所需的 Reader 蛋白。
在药物发现领域,CADD技术可以加速药物研发,而CADD又下分为SBDD,LBDD,FBDD,以及最近大热的AIDD。在SBDD领域,DOCKING始终是绕不开的话题,也是高通量虚拟筛选的利器,本文通过一篇综述,来尽可能的将DOCKING这一概念阐释清晰。
今天介绍美国密歇根州立大学Guo-Wei Wei团队近期在bioRxiv上发表的论文,该论文利用基于机器智能的复合型生成网络(GNC)生成一系列候选药物,并测试这些药物和部分艾滋病药物对新型冠状病毒的潜在效用。
2023年1月4日,来自美国卡内基梅隆大学的研究者在Journal of Chemical Information and Modeling上发表文章“Active Learning Guided Drug Design Lead Optimization Based on Relative Binding Free Energy Modeling”。
在蛋白激酶/磷酸酶被发现的初期,人们并没有意识到蛋白激酶/磷酸酶与疾病之间的广泛关联性。1978 年第一个致癌基因劳斯氏肉瘤病毒 (Rous sarcoma virus, v-Src) 的转化因子被证实是一种蛋白激酶。1981 年发现 PKC 可以被促进肿瘤发生的佛波酯 (PMA) 激活。这些发现证明了蛋白质磷酸化在疾病发生中的重要作用,也拉开了以蛋白激酶/磷酸酶为靶点的药物开发的序幕。
核苷(酸)类似物(Nucleos(t)ide Analogue)是最大的一类抗病毒药物,也是最重要的抗病毒药物。治疗疱疹(HSV)的阿昔洛韦(Acyclovir),第一种治疗艾滋病(HIV)的药物齐多夫定(Zidovudine),治疗乙肝(HBV)的恩替卡韦(Entecavir)以及Gilead的明星丙肝药(HCV),史上最贵的药片索菲布韦(Sofosbuvir)都属于这一类药物。除了抗病毒,核苷(酸)类似物还可以用于治疗癌症。
今天为大家介绍的是来自Ursula Rothlisberger研究团队的一篇关于金属离子位置预测的论文。金属离子是许多蛋白质的重要辅因子,在酶设计、蛋白质相互作用设计等许多应用中发挥关键作用,它们在生物体中丰富存在,并通过强烈的相互作用与蛋白质结合,并具有良好的催化特性。然而,生物相关金属(如锌)的复杂电子结构限制了金属蛋白质的计算设计。在这项工作中,作者开发了两个工具——基于3D卷积神经网络的Metal3D和仅基于几何标准的Metal1D,以改进蛋白质结构中锌离子的位置预测。与其他当前可用的工具进行比较显示,Metal3D是迄今为止最准确的锌离子位置预测器,其预测结果与实验位置相差在0.70 ± 0.64 Å范围内。Metal3D为每个预测位置输出置信度指标,并可用于在蛋白质数据库中具有较少同源物的蛋白质上工作。Metal3D可以预测全局锌密度,用于计算预测结构的注释,还可以预测每个残基的锌密度,用于蛋白质设计工作流程中。Metal3D目前是针对锌进行训练的,但通过修改训练数据,该框架可以轻松扩展到其他金属。
这个AI能够自主学习蛋白质结构与功能关系。而且在糖苷水解酶领域创造出的新蛋白质,比原始蛋白质更稳定。
CADD,DRUG,VIRUS 1 标题:Drugging the 'undruggable'. Therapeutic targeting of protein-DNA interactions with the use of computer-aided drug discovery methods. 杂志:Drug Discov Today 发表日期:2021/08/01 06:00 作者:Cherkasov A PMID:34332092 摘要: 转录因子 (TF) 在许多癌症中充当主要的肿瘤驱动因
在过去的十年中,宏基因组测序技术以惊人的速度提供了越来越多的蛋白序列数据,这些数据已被用于各研究领域,如研究肠道微生物群在人类疾病和衰老中的作用。然而,在收集的所有宏基因组序列中,只有一小部分在功能或结构上进行了表征,其中大部分尚未被探索。近日《Computational and Structural Biotechnology Journal》发表了一篇Mini review,回顾了宏基因组数据如何被用于蛋白质结构预测和蛋白质发现。
在芯片、测序和组学等遍地开花的时代,前人已经积累了大量数据,而且信息是公开的、免费的。因此,如果我们用别人的数据发表自己的论文,从海量数据中挖掘点自己需要的东西,岂不是件很赚的事情。
大数据文摘授权转载自学术头条 如今,脱发已经成为让当代年轻人十分头疼的问题。由于日常工作与生活节奏快、压力大,以及作息习惯不规律等问题,脱发秃顶、发际线变高已经逐渐年轻化。 忽略年龄,对于任何人而言,脱发都是一件令人十分苦恼的事情,因为一个人的发型往往与他们的自信程度存在一定关联。 面对“秃如其来”的窘迫状况,有些人选择接受秃头的现实,有些人则希望能够重新获得满头的乌黑秀发。 如今,人工智能(AI)技术或许可以成为人们摆脱脱发困扰的好帮手。 近日,青岛科技大学环境与安全工程学院王丽娜副教授团队、材料
今天为大家介绍的是来自Debora Marks团队的一篇论文。近期在人工智能领域的突破性进展,加上蛋白质序列和结构数据的快速积累,已经彻底改变了计算蛋白质设计的面貌。新方法有望打破自然和实验室进化的限制,加速生成用于生物技术和医学中的蛋白质。为了理解机器学习方法多样化爆炸的情况,作者提出了一个统一的框架,该框架根据模型使用的三种核心数据模态来分类:序列、结构和功能标签。
HiC-Pro软件非常灵活,不仅可以处理各种不同建库方式的Hi-C数据,也可以处理capture Hi-C数据。软件安装过程如下
KEGG(Kyoto Encyclopedia of Genes and Genomes,京都基因与基因组百科全书)是一个数据库资源,用于从分子水平的信息,了解生物系统(如细胞、生物体和生态系统)的高层次功能和效用。
名字很长,翻译为转座酶可及的染色质区域的高通量测序。在这个冗长的名字中,高通量测序我们一点都不陌生,NGS二代测序已经发展了这么多年,各种组学技术,比如WES, WGS, RNA_seq等等,应用非常广泛。那么”转座酶可及的染色质区域”又是什么呢?这个词应该这样来理解,通过转录酶获取到的染色质可及区域。
复合糖作为糖类与蛋白质或者脂质结合的产物 ,在生物中分布广泛,具有重要的功能。GLYCAN 数据库收录了实验验证过的复合糖的信息,主要是结构信息。每条记录用G number 标识,比如 G00197。
CNS library 精选具有低极性表面积(TPSA< 70 Å2)、低 ClogP (平均为1.63)、低氢键形成程度(氢键供体和受体的总数小于 8 )、低 MW(平均为283) 等具有高血脑屏障穿透率的化合物,专为研究中枢神经系统疾病的研究人员而设计。
蛋白泛素化 (Protein ubiquitination) 是指在泛素酶的催化作用下,给底物蛋白添加泛素分子的过程。蛋白泛素化是体内普遍存在的一种翻译后修饰,对蛋白的降解、DNA 修复、细胞周期调控,基因表达调控等发挥重要作用,在肿瘤、神经性退行疾病,心血管疾病等疾病治疗中具有重要意义。
不增加对正常组织和器官毒性的情况下提高治疗效果是抗肿瘤治疗的一大难题。众所周知,肿瘤细胞过度表达碱性磷酸酶。碱性磷酸酶是临床上测试最多的肿瘤生物标志物。在活细胞碱性磷酸酶活性谱的研究中发现碱性磷酸酶存在于多种肿瘤细胞(例如HeLa和Saos2)的表面,而不存在于骨髓基质细胞(例如HS-5)的表面。在此,布兰迪斯大学徐兵教授团队将细胞表面的碱性磷酸酶作为上下游相关信号提高蛋白酶抑制剂硼替佐米的疗效,从而有效抑制肿瘤细胞,并减少硼替佐米的毒副作用(如对骨髓基质细胞的毒性)。
前面我们说到了那些简单的由单个基因决定的性状,这东西不需要预测,其中的生物学机制已经研究的非常透彻,只要拿到你的基因信息,很容易推断你的性状,比如人的乙醇脱氢酶和乙醛脱氢酶等多种乙醇代谢基因,你本身是什么基因型,就决定了你的酒量,后天的折磨只能提高自己的耐受力而已。 【直播】我的基因组65:什么性状一定是由单个基因简单决定的? 很多朋友就问我了,我不想知道喝酒的能力,我给你一个陌生人的全部基因组信息,你能推断出他的家乡,姓名,肤色,头发,眼皮单双情况,血型,是否有酒窝,身高体重,学习成绩,是否将来会秃顶,跑
研究人员使用X-ray晶体学方法揭示了SARS-CoV-2主要蛋白酶的结构,设计了与该靶标结合并阻止病毒复制的抑制剂。该工作发表在2020年3月20日的《Science 》上。
今天给大家介绍的是由美国达纳-法伯癌症研究所Katherine A. Donovan等人在Cell上发表的文章” Mapping the Degradable Kinome Provides a Resource for Expedited Degrader Development”。
kegg compound 数据库存储了在生命活动中发挥作用的各种小分子,生物大分子和其他类型的化学物质,采用C number 进行标识,比如C00047, 代表L-赖氨酸。除了名称等信息外,还存储了该物质的化学结构和其他相关信息;
今天为大家介绍的是来自Chu-Chung Lin团队的一篇关于药物设计的论文。药物发现和开发流程是一个漫长而复杂的过程,对于计算方法和药物化学家来说都具有挑战性,并且迄今为止无法通过计算方法解决。深度学习已在各个领域得到应用,并在制药行业的新药设计中取得了巨大成功。作者提出了一种名为AIMLinker的深度神经网络,以快速设计和生成具有意义的药物样蛋白酶靶向嵌合体(PROTACs)类似物。该模型从输入片段中提取结构信息并生成连接器以将它们结合起来。作者在模型中集成了过滤器,以排除通过蛋白质-蛋白质复合物引导的无法药用的结构,同时保留具有强大化学性质的分子。随后,通过分子对接,采用均方根偏差(RMSD)、相对吉布斯自由能(ΔΔGbinding)、分子动力学(MD)模拟和自由能扰动(FEP)计算作为测量标准,测试所提出模型的鲁棒性和可行性。所生成的新型PROTACs分子在与结合口袋相比,具有类似的结构信息且具有更高的结合亲和力,相较于现有的CRBN-dBET6-BRD4三元复合物。作者展示了利用AIMLinker设计PROTACs分子的方法的有效性,这些分子在化学性质上优于dBET6晶体构象。
上述分子的体现了降解剂的结构与应用类型的丰富性,但降解剂类分子的合理设计与不断优化以及活性检测仍有很长的路要走。
背景: 通过实验对比了几种糖苷类化合物在葡萄糖苷酶的水解速率,希望通过计算机解释其水解机理。但是RCSB数据库中只有少量几种beta葡萄糖苷酶的晶体数据,不包含本次试验采用的是苦杏仁的beta葡萄糖苷酶,所以需要通过同源建模的方法建立蛋白质的三维结构。 方法: 蛋白质测序得到FASTA氨基酸序列文件 1.Swiss-model服务器同源建模 结果: 通过对比模版,选择同源度(identities)最高68%,覆盖度(coverage)达99%的蛋白质结构,PDB ID为:3CGB最为模版,进行苦杏仁的BET
领取专属 10元无门槛券
手把手带您无忧上云