首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    TCBB|基于多视角图嵌入学习模型识别蛋白质折叠结构

    今天给大家介绍北京理工大学刘滨教授和哈工大(深圳)徐勇教授团队在“IEEE/ACM Transactions on Computational Biology and Bioinformatics“上发表的工作 “Protein Fold Recognition Based on Auto- Weighted Multi-view Graph Embedding Learning Model”。蛋白质折叠识别对于蛋白质结构预测和药物设计都至关重要。目前已经提出一些方法来从蛋白质序列提取有识别度的特征来进行折叠识别,但是如何集成这些特征以提高预测准确性,仍是一个具有挑战性的问题。在本文中,作者提出两种新的模型:AWMG和EMfold。AWMG是一种基于多视图学习框架的模型,其将每个视图视为对应蛋白质数据源的中间表示形式,例如进化信息和检索信息。Emfold是一种集成模型,它结合AWMG和DeepSS这两种互补的方法,其中DeepSS是一种基于模板的算法,集成了SPARKS-X 和 DeepFR 算法。Emfold集成了基于模板算法和机器学习的优势。实验结果表明,AWMG 和 Emfold的性能显著优于其他现有的预测方法。

    04

    TCBB|基于多视角图嵌入学习模型识别蛋白质折叠结构

    今天给大家介绍北京理工大学刘滨教授和哈工大(深圳)徐勇教授团队在“IEEE/ACM Transactions on Computational Biology and Bioinformatics“上发表的工作 “Protein Fold Recognition Based on Auto- Weighted Multi-view Graph Embedding Learning Model”。蛋白质折叠识别对于蛋白质结构预测和药物设计都至关重要。目前已经提出一些方法来从蛋白质序列提取有识别度的特征来进行折叠识别,但是如何集成这些特征以提高预测准确性,仍是一个具有挑战性的问题。在本文中,作者提出两种新的模型:AWMG和EMfold。AWMG是一种基于多视图学习框架的模型,其将每个视图视为对应蛋白质数据源的中间表示形式,例如进化信息和检索信息。Emfold是一种集成模型,它结合AWMG和DeepSS这两种互补的方法,其中DeepSS是一种基于模板的算法,集成了SPARKS-X 和 DeepFR 算法。Emfold集成了基于模板算法和机器学习的优势。实验结果表明,AWMG 和 Emfold的性能显著优于其他现有的预测方法。

    01

    Nat Methods | OpenFold:对AlphaFold2重新训练提供了关于其学习机制和泛化能力的新见解

    今天为大家介绍的是来自Mohammed AlQuraishi团队的一篇论文。AlphaFold2凭借极高的蛋白质结构预测准确性,彻底改变了结构生物学。然而,其实现方式缺乏训练新模型所需的代码和数据。这些对于解决新任务(如蛋白质-配体复合物结构预测)、研究模型的学习过程以及评估模型在未见过的折叠空间区域的泛化能力都是必要的。在此,作者介绍了OpenFold,这是一种快速、高效且可训练的AlphaFold2实现。作者从零开始训练OpenFold,达到了与AlphaFold2相同的准确性。在此基础上,作者发现OpenFold在泛化能力上表现出色,即使训练集的规模和多样性被刻意限制,包括几乎完全排除某些二级结构元素类别的情况。通过分析训练过程中产生的中间结构,作者还获得了OpenFold在折叠学习过程中层次化方式的见解。总之,作者的研究展示了OpenFold的强大和实用性,并相信其将成为蛋白质建模领域的重要资源。

    02

    生化小课 | 蛋白质的四级结构范围从简单的二聚体到大的复合物(含蛋白质三级和四级结构 小结)

    许多蛋白质具有多个多肽亚基(从两个到数百个)。多肽链的结合可以发挥多种功能。许多多亚基蛋白具有调节作用;小分子的结合可能会影响亚基之间的相互作用,导致蛋白质活性的巨大变化,以响应底物或调节分子浓度的微小变化。在其他情况下,单独的亚基承担单独但相关的功能,例如催化和调节。一些关联,例如在本章前面讨论的纤维蛋白和病毒外壳蛋白中看到的关联,主要发挥结构作用。一些非常大的蛋白质组装体是复杂的多步骤反应的场所。例如,每个核糖体(即蛋白质合成位点)都包含数十个蛋白质亚基以及 RNA 分子。

    02

    斯坦福、微软联手,用扩散模型进行蛋白质结构生成,已开源

    机器之心报道 机器之心编辑部 尽管最近研究者在蛋白质结构预测方面取得了进展,但从神经网络直接生成不同的、新颖的蛋白质结构仍然很困难。在这项工作中,本文提出了一种新的基于扩散的生成模型,该模型通过一种反映蛋白质原生折叠过程的过程来设计蛋白质的主链结构。 蛋白质对生命至关重要,几乎在每个生物过程中都发挥着作用。一方面它们能在神经元之间传递信号、识别微观入侵者并激活免疫反应等。另一方面,蛋白质作为一种治疗介质已经得到广泛研究,成为治疗疾病的一部分。因此,通过生成新的、物理上可折叠的蛋白质结构,打开了利用细胞通路治

    03

    Bioinformatics|利用进化概况、突变耦合和二维迁移学习改进了RNA二级结构和三级碱基配对预测

    今天给大家介绍Jaswinder Singh等人在Bioinformatics上发表的文章”Improved RNA secondary structure and tertiary base-pairing prediction using evolutionary profile, mutational coupling and two-dimensional transfer learning”。最近发现的许多非编码RNA(特别是长非编码RNA)改变了我们对RNA在生物体中作用的看法,但是由于现有的实验技术无法有效地解决高分辨率的二级和三级结构,阻碍了我们对它们的理解。另一方面,通过对大量近似数据的深度学习,然后是对高分辨率三维结构的金标准碱基配对结构的迁移学习,对RNA二级结构的计算预测进行了急需的改进。本文将这种基于单序列的学习扩展到使用进化概况和突变耦合,不仅可以大大改进规范碱基对(RNA二级结构),而且可以进一步改进与三级碱基对相关的碱基对,如pseudoknots, non-canonical 和 lone 碱基对。特别的,本文模型对1000多个同源序列RNA预测非常精确,得到大于0.8的F1-score,本文通过结合没有任何修改的人工的,但功能相同的同源序列,显著提高了碱基配对预测。总体上来说,本文的全自动方法为科学界提供一个新的强大工具,不仅可以捕获二级结构,而且可以捕获用于构建三维模型的三级碱基配对信息,它还强调了通过使用大量的自然和/或人工同源序列来精确解决碱基配对结构的未来。

    01
    领券