前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【Briefings in Bioinformatics】四篇好文简读-专题21

【Briefings in Bioinformatics】四篇好文简读-专题21

作者头像
智能生信
发布2022-02-11 09:38:11
3750
发布2022-02-11 09:38:11
举报
文章被收录于专栏:智能生信智能生信

论文题目:

SMNN: batch effect correction for single-cell RNA-seq data via supervised mutual nearest neighbor detection

论文摘要:

当整合来自多个批次的单细胞RNA测序(scRNA-seq)数据时,批效应校正被认为是必不可少的。最先进的方法忽略了单细胞聚类标签信息,但这些信息可以提高批次效应校正的有效性,特别是在生物差异与批次效应不正交的现实情况下。为了解决这个问题,我们提出了SMNN,通过监督互最近邻检测对单细胞RNA测序数据进行批量效应校正。我们在仿真和真实数据集的广泛评估表明,SMNN提供了跨批次相应细胞类型的改进合并,使MNN、Seurat v3和LIGER在跨批次分化减少。此外,SMNN保留了更多的细胞类型特异性特征,部分表现为经过SMNN校正后发现的细胞类型之间的差异表达基因在生物学上更相关,精度提高了高达841.0%。

论文链接:

https://academic.oup.com/bib/article-abstract/22/3/bbaa097/5855265?redirectedFrom=fulltext

论文题目:

Quantitative model suggests both intrinsic and contextual features contribute to the transcript coding ability determination in cells 论文摘要:

基因转录和蛋白质翻译是“中心法则”的两个关键步骤。对影响哺乳动物转录本编码能力的反褶曲因子进行定量分析仍然是一个重大挑战。文章提出了核糖体计算器(RiboCalc),用于定量模拟人类基因组中rna的编码能力。除了通过序列和转录特征高效预测实验确认的大量编码外,RiboCalc还提供了与生物信息相关的可解释参数。大规模分析进一步揭示了许多转录本具有不同类型细胞的各种编码能力(即上下文依赖的编码转录本),这表明,与传统智慧相反,转录本的编码能力应该被建模为一个具有上下文依赖性质的连续谱。

论文链接:

https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbab483/6445106 Github链接:

http://github.com/gaolab/RiboCalc/tree/master

论文题目:

scIAE: an integrative autoencoder-based ensemble classification framework for single-cell RNA-seq data

论文摘要:

单细胞RNA测序可以在单细胞水平上定量分析基因表达,有利于研究细胞异质性。细胞类型的识别有助于复杂组织或生物中细胞图谱的构建,这是几乎所有下游scRNA-seq数据分析的基础。利用与疾病相关的scRNA-seq数据对疾病状态进行预测,有利于疾病的特异性诊断和个体化治疗。针对单细胞基因表达数据高维、稀疏且有断点的特点,文章提出了基于集成自编码器的集成分类框架scIAE,该框架首先进行多次随机投影,然后应用集成的可设计的自编码器,以获得降维特征。然后在低维表示的基础上建立基分类器,综合所有基模型的预测结果。scIAE与常用特征提取方法的比较表明,scIAE是有效的、鲁棒的,不受维数选择的影响,有利于后续的细胞分类。通过对不同类型数据进行测试,并与现有的通用和单细胞特异性分类方法进行比较,证明scIAE在数据集内细胞类型注释、跨批次、跨平台、跨物种以及疾病状态预测等方面具有很强的分类能力。

论文链接:

https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbab508/6463428 Github链接:

https://github.com/JGuan-lab/scIAE

论文题目:

OPUS-Rota4: a gradient-based protein side-chain modeling framework assisted by deep learning-based predictors 论文摘要:

准确的蛋白质侧链模型是蛋白质折叠和蛋白质设计的关键。在过去的几十年里,许多成功的方法被提出来解决这个问题。然而,它们大多依赖于来自rotamer库的离散样本,这可能对它们的准确性和用法有限制。文章开发了一个蛋白质侧链建模的开源工具包,名为OPUS-Rota4。它由三个模块组成:OPUS-RotaNN2,预测蛋白质侧链二面角;OPUS-RotaCM,它测量不同残差对侧链与OPUS-Fold2之间的距离和方向信息,利用前两个模块的约束来指导侧链建模。OPUS-Rota4采用OPUS-RotaNN2预测的二面角作为初始状态,OPUS-Fold2利用OPUS-RotaCM推导的侧链接触映射约束来细化侧链构象。因此,文章将边链建模问题转化为边链接触图预测问题。OPUS-Fold2是用Python和TensorFlow2.4编写的,其中包含了其他可微能量项,对用户很友好。

论文链接:

https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbab529/6461160

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-01-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 智能生信 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档