前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >单细胞测序公共数据库(下)

单细胞测序公共数据库(下)

作者头像
生信交流平台
发布2020-08-05 10:00:27
5K0
发布2020-08-05 10:00:27
举报
文章被收录于专栏:用户7627119的专栏

单细胞测序技术是近几年来非常热门的话题。但在该领域中,仍然缺乏存储单细胞公共数据的平台,因此这些数据集的可访问性成为其有效使用的障碍。此外,通过外部单细胞数据进行自身数据的验证也是今后单细胞数据分析的一个重要趋势。前面一期我们介绍了单细胞测序公共数据库(上),今天,小编就基于上篇的基础,继续为大家介绍几款单细胞测序公共数据库。

1、SCPortalen

SCPortalen收集了人类和小鼠已发表的单细胞转录组学数据,包含原始数据和元数据(数据详细信息)。此外,该网站还存储了单细胞的图像和动态影片,以便对细胞状态和捕获细胞的质量进行检查。当前该网站收录了人类79种细胞类型的20761个单细胞以及小鼠119种细胞类型的46385个单细胞的单细胞转录组数据。

SCPortalen主页:http://single-cell.clst.riken.jp

SCPortalen为用户设计了以下几个功能:首先,用户可以一览相关研究的信息,包括数据集的GEO编号(例如:GSE48968)、类型、标题、相关研究的摘要、元数据、公共数据存储库的链接、PubMed检索号、PCA、t-SNE图等。其次,用户可以搜索某个基因的FPKM值,在搜索时,用户既可填写基因ID(例如:ENSG00000000003.14),也可以填写基因名称(例如:TSPAN6)。最后,SCPortalen为用户提供了数据集的URL地址列表,以便用户利用wget命令来下载整套BAM文件,FastQC报告以及FPKM表达矩阵。

SCPortalen数据集详细信息

SCPortalen基因搜索界面

SCPortalen数据下载界面

2、scRNASeqDB

scRNASeqDB是一个专门收集人类单细胞测序数据的数据库,涉及36个人类数据集约174种细胞类型或细胞系的8910个细胞。但可惜的是,该数据库只更新到2017年,现已停止更新。scRNASeqDB主要目的是促进基于公共数据的各种人类单细胞基因表达谱的分析和可视化。在数据下载方面,该网站仅仅展示数据的来源(文章名字,文章摘要等),用户仍需根据SRA数据的链接或者GEO编号去NCBI上下载。

scRNASeqDB主页:https://bioinfo.uth.edu/scrnaseqdb/

scRNASeqDB主页提供三种搜索方法。首先,用户可以利用基因名或者基因ID搜索感兴趣的基因,例如:在“by gene”框中搜索TBK1基因,“Gene Rank List”版块将会展示TBK1基因在不同数据集中的表达,而“Gene View“则展示TBK1基因在数据集中详细的表达情况。

scRNASeqDB根据基因搜索返回的结果

其次,用户可以搜索感兴趣的细胞,例如,在“by cell”框中搜索先天淋巴细胞,“cell view”版块将会展示细胞的详细信息列表(包括实验设计、文献题目、GEO编号、PMID检索号),样本信息列表以及该细胞最相关的200个上调基因。

scRNASeqDB根据基因搜索返回的结果

最后,用户可以通过数据集ID来进行检索,以“GSE69405”为例,结果将返回该数据集的详细列表、细胞类型以及差异基因列表。

scRNASeqDB根据数据集ID搜索返回的结果

3、PanglaoDB

在前面的分享中,小编提过PanglaoDB是一个包含了6000多个marker基因,可用于细胞分群注释的marker数据库。此外,PanglaoDB还囊括了1368个人类和小鼠样本的单细胞测序数据。用户可以通过点击“Datasets”中的下拉菜单选择“Samples”。在“filtered by species”“filtered by protocols”“sorted on”下拉菜单中选择不同测序平台、不同物种、按不同关键词排序的单细胞数据。然后,用户可以点击“view”按钮进入数据的详细界面,包含SRA编号、测序平台、物种、细胞数等。在数据下载一栏中,用户可以点击“Compressed plain text matrix”下载到相应样本的矩阵数据,但是关于样本更详细的信息仍需根据SRA编号去NCBI中搜索。

PanglaoDB主页 网址:https://panglaodb.se/index.html

PanglaoDB数据下载页面

4、Single cell portal

Single cell portal最初是作为BRAIN(通过先进的神经技术进行脑部研究)计划的一部分而开发的。该网站开发的主旨为:促进科学成果的共享,并传播因单细胞测序技术而产生的数据。相比于前三个数据库(多为低通量测序数据,细胞数较少)来说,Single cell portal收录了169个研究的4152655个单细胞的测序数据,并且仍在持续更新当中。用户可以在主页上搜索自己感兴趣的研究,进入下载界面后,点击“download”下载相关数据,但是,Single cell portal数据库限制每天数据的下载量,一旦达到下载阈值后(512GB),则需在第二天下载。此外,用户也可以自己创建账户,上传自己文章的数据。

Single cell portal主页:https://singlecell.broadinstitute.org/single_cell

Single cell portal数据下载界面

结合上下篇,小编总共为大家介绍了七款单细胞公共数据库,如果你想利用公共数据对自己的数据进行验证,或者想要深挖公共数据,不妨试一试吧!

参考文献

Abugessaisa I, Noguchi S, Böttcher M, Hasegawa A, Kouno T, Kato S,Tada Y, Hiroki U, Abe K, Shin JW, Plessy C, Carninci P, Kasukawa T. SCPortalen: human and mouse single-cell centric database, Nucleic Acids Research, Volume 46, Issue D1, 4 January 2018, Pages D781–D787.

Cao Y, Zhu J, Jia P, Zhao Z. (2017) scRNASeqDB: A Database for RNA-Seq Based Gene Expression Profiles in Human Single Cells. Genes 8(12), 368.

Oscar Franzén, Li-Ming Gan, Johan L M Björkegren. PanglaoDB: a web server for exploration of mouse and human single-cell RNA sequencing data, Database, Volume 2019, 2019, baz046, doi:10.1093/database/baz046.

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-06-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信交流平台 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档