一
论文题目
Secondary structure prediction for RNA sequences including N6-methyladenosine
摘要
人们对共价修饰核苷酸在 RNA 中的作用越来越感兴趣。然而,由于缺乏软件和热力学参数,无法解释二级结构预测的修饰的存在。作者提出了N6-甲基腺苷 (m6A) 的这些问题的解决方案,允许对 A、C、G、U 和 m6A 的字母表进行二级结构预测。RNAstructure 软件现在适用于任何大小的用户定义的核苷酸字母表。作者还使用实验报告了一组包含 m6A 的螺旋和环的最近邻参数。有趣的是,N6-甲基化降低了螺旋中间腺苷的折叠稳定性,对螺旋末端腺苷的折叠稳定性几乎没有影响,而增加了堆叠在螺旋上的未配对腺苷的折叠稳定性。工作主要集中在对来自 MALAT1 的 N6 甲基化激活的蛋白质识别位点的预测以及 N6 甲基化对腺苷被埋在螺旋中的概率的人类转录组范围的影响。
论文地址
https://www.nature.com/articles/s41467-022-28817-4#Ack1
代码地址
http://rna.urmc.rochester.edu/RNAstructure.html
二
论文题目:
A deep-learning framework for multi-level peptide–protein interaction prediction
论文摘要:
肽-蛋白质的相互作用参与了各种基本的细胞功能,它们的识别对于设计有效的肽治疗药物至关重要。最近,人们开发了许多计算方法来预测肽-蛋白质的相互作用。然而,大多数现有的预测方法严重依赖于高分辨率的结构数据。作者在本文提出了一个多层次的肽-蛋白质相互作用预测的深度学习框架,称为CAMP,包括二元肽-蛋白质相互作用预测和相应的肽结合残基识别。综合评估表明,CAMP能够成功捕捉到肽和蛋白质之间的二元相互作用,并识别参与相互作用的肽沿线的结合残基。此外,CAMP在二元肽-蛋白质相互作用预测方面的表现优于其他最先进的方法。CAMP可以作为多肽-蛋白质相互作用预测和识别多肽中重要结合残基的有用工具,从而促进多肽药物发现过程。
论文链接:
https://www.nature.com/articles/s41467-021-25772-4
Github链接:
https://github.com/twopin/CAMP
三
论文题目:
Active label cleaning for improved dataset quality under resource constraints 论文摘要:
数据注释中的缺陷,即所谓的标签噪声,对机器学习模型的训练是不利的,并对模型性能的评估有干扰作用。然而,在资源有限的情况下,如医疗保健,雇用专家通过完全重新注释大型数据集来消除标签噪音是不可行的。这项工作主张采用一种数据驱动的方法来确定重新标注样本的优先次序--称之为 "主动标签清理"。作者建议根据每个样本的估计标签正确性和标签难度对实例进行排序,并引入一个模拟框架来评估重新标注的效果。作者在自然图像和专门设计的医学成像基准上的实验表明,清理噪声标签可以减轻它们对模型训练、评估和选择的负面影响。最重要的是,所提出的方法能够在现实条件下比典型的随机选择更有效地纠正标签,更好地利用专家的宝贵时间来提高数据集质量。
论文链接:
https://www.nature.com/articles/s41467-022-28818-3 Github:
https://github.com/microsoft/InnerEye-DeepLearning
四
论文题目:
A platform for oncogenomic reporting and interpretation
论文摘要:
人工解释变异体仍然是精准肿瘤学的限制因素。随着精准肿瘤学从单个病人扩展到整个人群,从癌症样本的全面测序中产生的分子数据的规模和复杂性不断增加,需要先进的解释平台。为了解决这一未满足的需求,作者推出了肿瘤基因组报告和解释平台(PORI),包括一个分析框架,以促进癌症体细胞变异的解释。PORI整合了报告和图知识库工具,并支持在报告阶段进行人工整理。PORI代表了商业报告解决方案的一个开源平台替代品,适用于精准肿瘤学的综合基因组数据集。作者通过将9,961个泛癌基因组图肿瘤与图知识库相匹配,计算治疗性信息改变,并提供描述特定个体样本的报告来证明PORI的效用。
论文链接:
https://www.nature.com/articles/s41467-022-28348-y
Github链接:
https://bcgsc.github.io/pori