前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >[Nat.Mach.Intell.|论文简读]scBERT 用于单细胞RNA-seq数据的细胞类型标注的大规模预训练深度语言模型

[Nat.Mach.Intell.|论文简读]scBERT 用于单细胞RNA-seq数据的细胞类型标注的大规模预训练深度语言模型

作者头像
智能生信
发布2022-12-29 17:08:02
6250
发布2022-12-29 17:08:02
举报
文章被收录于专栏:智能生信

简读分享 | 蒋一 编辑 | 陈兴民

论文题目

scBERT as a large-scale pretrained deep language model for cell type annotation of single-cell RNA-seq data

论文摘要

在单细胞RNA-seq数据的基础上对细胞类型进行标注是研究疾病进展和肿瘤微环境的先决条件。这里作者表明,现有的方法通常缺乏策划的标记基因列表,对批量效应处理不当,难以利用潜在的基因-基因互动信息,损害了它们的通用性和稳健性。作者开发了一个基于深度神经网络的预训练模型,即来自transformers的单细胞双向编码器表示法(scBERT)以克服这些挑战。按照BERT的预训练和微调方法,scBERT通过对大量未标记的scRNA-seq数据进行预训练,获得了对基因-基因相互作用的一般理解;然后将其转移到未见过的和用户特定的scRNA-seq数据的细胞类型标注任务中,进行监督微调。广泛而严格的基准研究验证了scBERT在细胞类型标注、新型细胞类型发现、对批次效应的鲁棒性和模型的可解释性方面的卓越性能。

论文链接

https://www.nature.com/articles/s42256-022-00534-z

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-10-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 智能生信 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档