一
论文题目:
Improved protein structure prediction by deep learning irrespective of co-evolution information
论文摘要:
通过整合深度学习和协同进化分析,从一级序列预测蛋白质的三级结构得到了极大的改进。作者描述了作者对这一想法的最新研究,分析了网络大小和协同进化数据的功效及其对天然和设计蛋白质的性能。大型 ResNet(卷积残差神经网络)可以预测 32 个 CASP13 自由建模目标中的 26 个和 L/5 远程接触的正确折叠结构,精度超过 80%。在不使用协同进化的情况下,ResNet 仍然可以预测 18 个 CASP13 自由建模目标的正确折叠结构,大大超过了以前不使用协同进化的方法。即使只有一级序列,ResNet 也可以预测所有经过测试的人工设计蛋白质的正确折叠结构。此外,在没有协同进化的情况下进行训练时,ResNet 对于设计的蛋白质可能比协同进化更好。这些结果表明,ResNet 不仅可以对协同进化信号进行去噪,还可以学习重要的蛋白质序列-结构关系。这对蛋白质设计和工程具有重要意义,尤其是在无法获得协同进化数据的情况下。
论文链接:
https://www.nature.com/articles/s42256-021-00348-5
Github链接:
https://github.com/j3xugit/RaptorX-3DModeling/
二
论文题目:
Multi-constraint molecular generation based on conditional transformer, knowledge distillation and reinforcement learning 论文摘要:
基于机器学习的生成模型可以从头开始生成具有理想的生理化学和药理学特性的新分子。许多优秀的生成模型已经被提出,但分子生成任务中的多目标优化对于大多数现有模型来说仍然具有相当的挑战性。作者提出了多约束分子生成(MCMG)方法,通过知识蒸馏将条件转化器(conditional transformer)和强化学习算法结合起来,可以满足多种约束。通过有效地学习并将结构-属性关系纳入一个有偏差的生成过程中,条件转化器(conditional transformer)被用来训练一个分子生成模型。然后采用知识蒸馏模型来降低模型的复杂性,以便通过强化学习有效地进行微调,提高生成分子的结构多样性。正如一组综合基准所证明的那样,MCMG是一种非常有效的方法,可以穿越庞大而复杂的化学空间,寻找满足多种属性约束的新型化合物。
论文链接:
https://www.nature.com/articles/s42256-021-00403-1 代码链接:
https://github.com/jkwang93/MCMG
三
论文题目:
Computationally instrument-resolution-independent de novo peptide sequencing for high-resolution devices 论文摘要:
新肽测序是从质谱中发现新肽的关键技术。测序结果的整体质量取决于从头肽测序算法和质谱的质量。在过去的十年中,质谱仪的分辨率和准确度提高了几个数量级,并产生了更高分辨率的质谱。如何在不大幅增加计算复杂度的情况下有效利用这些高分辨率数据,仍然是新肽测序工具面临的挑战。由此本文提出了PointNovo,一个基于神经网络的从头肽测序模型,可以稳健地处理任何分辨率的质谱数据,同时保持计算复杂性不变。广泛的实验结果表明,PointNovo通过利用最新的质谱仪的超高分辨率,优于现有的从头肽测序工具。 论文链接:
https://www.nature.com/articles/s42256-021-00304-3
四
论文题目:
An automated framework for efficiently designing deep convolutional neural networks in genomics 论文摘要:
卷积神经网络(CNNs)已经成为生物序列分析的标准。网络架构的调整对CNN的性能至关重要,但它需要大量的机器学习知识和投入的时间和精力。因此,这一过程对现代深度学习在基因组学上的广泛和有效应用构成了主要障碍。由此本文提出了生物循证研究自动化建模(AMBER),一个完全自动化的框架,有效地设计和应用基因组序列的CNN。AMBER通过最先进的神经结构搜索(NAS)为用户指定的生物问题设计最佳模型,本文将AMBER应用到基因组调控特征建模的任务中,并证明了AMBER设计的模型的预测明显比等效基线非NAS模型更准确,匹配甚至超过已发表的专家设计模型。对AMBER建筑搜索的解读揭示了它的设计原则,即利用计算操作的全部空间来精确建模基因组序列。此外,本文说明了利用AMBER精确发现等位基因特异性结合和疾病遗传富集的功能基因组变异。AMBER为基因组学中设计精确的深度学习模型提供了一种高效的自动化方法。
论文地址:
https://www.nature.com/articles/s42256-021-00316-z
欢迎关注公众号,获取更多论文解读
转载或合作请联系邮箱 intbioinfo@163.com