前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【Bioinformatics】四篇好文简读-专题10

【Bioinformatics】四篇好文简读-专题10

作者头像
智能生信
发布2022-02-11 09:39:11
6410
发布2022-02-11 09:39:11
举报
文章被收录于专栏:智能生信

论文题目:

Protein–RNA interaction prediction with deep learning: structure matters 论文摘要:

综述。蛋白质和RNA的相互作用对多种细胞活动至关重要,但由于以往数据库的局限性,特别是蛋白质结构数据的缺乏,现有的计算方法大多依赖于序列数据,只有一小部分方法利用了结构信息。本文作者对该领域进行了全面的回顾,调查了结合位点和结合偏好预测问题,并涵盖了常用的数据集、特征和模型,综述了RNA结合蛋白和RNA相互作用领域过去的发展,并对后alphafold(一种蛋白质结构预测算法)时代RNA结合蛋白和RNA相互作用领域的未来发展进行了展望。

论文链接:

https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbab540/6470965

论文题目:

DeepSVP: Integration of genotype and phenotype for structural variant prioritization using deep learning 论文摘要:

结构基因组变异占人类变异的很大一部分,并涉及多种疾病。结构变异很复杂,可能会影响多个基因的编码区,或者以不同于单核苷酸变异的方式影响基因组区域的功能。解释结构变异的表型结果依赖于有关基因功能、单倍体或三倍体敏感性以及其他基因组特征的信息。基于表型的方法来识别涉及遗传疾病的变异,将分子特征与关于改变基因功能的表型后果的先验知识相结合。虽然基于表型的方法已成功应用于单核苷酸变异以及短插入和缺失,但结构变异的复杂性使得将它们与表型联系起来更具挑战性。此外,结构变异会影响大量编码区,并且可能无法获得所有编码区的表型信息。作者开发了 DeepSVP,这是一种计算方法,通过结合基因组和基因功能信息来优先考虑遗传疾病中涉及的结构变异。作者整合了与基因相关的表型、基因产物的功能、单个细胞类型中的基因表达以及表达的解剖位点,并通过本体论和机器学习系统地将它们与它们的表型结果联系起来。DeepSVP 显着提高了在几个基准中发现致病变异的成功率,并且可以在近亲家族中识别新的致病结构变异。

论文链接:

https://doi.org/10.1093/bioinformatics/btab859 GitHub链接:

https://github.com/bio-ontology-research-group/DeepSVP

论文题目:

AMC: accurate mutation clustering from single-cell DNA sequencing data 论文摘要:

单细胞 DNA 测序 (scDNA-seq) 现在可以实现肿瘤内异质性的高分辨率图谱。从 scDNA-seq 数据进行系统发育推断的现有方法在小数据集上表现良好,但在大数据集上计算效率低且准确性下降。受单细胞上有着同一共同状态的突变可以组合在一起这一事实的启发,作者提出了一种称为 AMC 的新方法来准确地对突变进行聚类,从而提高系统发育推断的效率。AMC 首先使用主成分分析,然后使用 K -means来查找突变簇,然后推断每个簇的基因型的最大似然估计。推断的基因型随后可用于高效地重建系统发育树。对各种模拟数据集的综合评估表明,AMC 对于有效推理大型 scDNA-seq 数据集上的突变簇特别有用。

论文链接:

https://academic.oup.com/bioinformatics/advance-article/doi/10.1093/bioinformatics/btab857/6482741 Github链接:

https://github.com/qasimyu/amc

论文题目:

CRPMKB: a knowledge base of cancer risk prediction models for systematic comparison and personalized applications 论文摘要:

在大数据和精准医疗时代,准确的风险评估是实施风险筛查和预防性治疗的前提。大量研究聚焦于癌症风险,构建了相关的风险预测模型,但缺乏有效的资源整合进行系统对比和个性化应用。因此,癌症风险预测模型知识库(CRPMKB)的建立和分析具有重要意义。模型比较表明,癌症风险预测的准确性受地区差异、癌症类型和模型类型的影响很大。作者将模型变量分为环境、行为生活方式、生物遗传学和临床检查四类,发现不同癌症类型之间各种变量的分布存在差异。以肺癌风险预测模型中涉及的50个基因为例进行通路富集分析,结果表明这些基因在与癌症和特定疾病相关的p53信号通路和芳基烃受体信号通路中显着富集。此外,通过STRING数据库验证了重叠肺癌基因的生物学意义。CRPMKB 的这项研究表明,基于特定人口特征和癌症类型开发更有针对性的模型将进一步提高癌症风险模型预测的准确性。

论文链接:

https://academic.oup.com/bioinformatics/advance-article/doi/10.1093/bioinformatics/btab850/6470559

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-01-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 智能生信 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档