前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >不应该让单细胞定量成为数据复用的阻碍

不应该让单细胞定量成为数据复用的阻碍

作者头像
生信技能树
发布2023-09-04 15:46:46
1230
发布2023-09-04 15:46:46
举报
文章被收录于专栏:生信技能树生信技能树

学员给了一个2023的单细胞文章:《Single-cell RNA sequencing reveals a mechanism underlying the susceptibility of the left atrial appendage to intracardiac thrombogenesis during atrial fibrillation》里面的单细胞转录组数据集仅仅是公开了数据集的fastq文件,并没有表达量矩阵。我们就顺手下载并且处理了。 PS : 这个文章虽然没有表达量矩阵,好歹是公开了数据集的fastq文件,比其它文章良心太多了(93% of authors indicating their data is available upon request do not respond or refuse to share their data.)

首先需要参考 小鼠的5个样品的10x技术单细胞转录组上游定量,走cellranger流程,主要是拿到服务器后配置自己的conda环境,以及下载项目对应的单细胞转录组数据集的fastq文件,如下所示:

代码语言:javascript
复制
ls -lh *z|cut -d" " -f 5-
 48G 6月  12 01:05 SRR18308247_1.fastq.gz
 47G 6月  12 01:39 SRR18308247_2.fastq.gz
 
 45G 6月  12 02:06 SRR18308248_1.fastq.gz
 44G 6月  12 02:32 SRR18308248_2.fastq.gz
 
 41G 6月  12 02:57 SRR18308249_1.fastq.gz
 31G 6月  12 03:15 SRR18308249_2.fastq.gz
 
 47G 6月  12 03:44 SRR18308250_1.fastq.gz
 36G 6月  12 04:07 SRR18308250_2.fastq.gz
 
 41G 6月  12 04:35 SRR18308251_1.fastq.gz
 34G 6月  12 04:56 SRR18308251_2.fastq.gz
 41G 6月  12 05:20 SRR18308252_1.fastq.gz
 37G 6月  12 05:43 SRR18308252_2.fastq.gz
 

有了这些文件,就需要很简单的改名操作,因为走cellranger流程,它软件要求。。。

代码语言:javascript
复制
ls -lh *z|cut -d" " -f 5-
  22 6月  12 21:51 A1_S1_L001_R1_001.fastq.gz -> SRR18308252_1.fastq.gz
  22 6月  12 21:54 A1_S1_L001_R2_001.fastq.gz -> SRR18308252_2.fastq.gz
  22 6月  12 21:51 A2_S1_L001_R1_001.fastq.gz -> SRR18308251_1.fastq.gz
  22 6月  12 21:54 A2_S1_L001_R2_001.fastq.gz -> SRR18308251_2.fastq.gz
  22 6月  12 21:51 B1_S1_L001_R1_001.fastq.gz -> SRR18308250_1.fastq.gz
  22 6月  12 21:54 B1_S1_L001_R2_001.fastq.gz -> SRR18308250_2.fastq.gz
  22 6月  12 21:51 B2_S1_L001_R1_001.fastq.gz -> SRR18308249_1.fastq.gz
  22 6月  12 21:54 B2_S1_L001_R2_001.fastq.gz -> SRR18308249_2.fastq.gz
  22 6月  12 21:51 C1_S1_L001_R1_001.fastq.gz -> SRR18308248_1.fastq.gz
  22 6月  12 21:54 C1_S1_L001_R2_001.fastq.gz -> SRR18308248_2.fastq.gz
  22 6月  12 21:51 C2_S1_L001_R1_001.fastq.gz -> SRR18308247_1.fastq.gz
  22 6月  12 21:54 C2_S1_L001_R2_001.fastq.gz -> SRR18308247_2.fastq.gz

如果是有自己的服务器要参考 小鼠的5个样品的10x技术单细胞转录组上游定量(文末赠送全套代码),走cellranger流程,是可以拿到表达量矩阵的。

但是文章描述的单细胞转录组数据处理流程有点奇怪:

  • Cells expressing <800 or >4000 genes per cell, and those with mitochondrial gene percentages >.1 were removed.
  • Cells with mitochondrial unique molecular identifier (UMI) counts >6% or ribosomal UMI counts >50% were also considered abnormal.
  • The batch effect was corrected, and the merged object was integrated by running Harmony (version 1.0).

不过文章里面的降维聚类分群还行:

降维聚类分群还行

因为前面的 小鼠的5个样品的10x技术单细胞转录组上游定量,写的很清楚了,这里就不赘述了。如果要做到文章里面的单细胞亚群的生物学命名,需要使用文章里面的基因,我这里就不耗费时间了。

做到文章里面的单细胞亚群的生物学命名

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2023-07-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档