文章的核心分析方法见摘要:对 49GTExtissuesandretin 中超过 240 个 POAG 和 IOP 全基因组关联研究 (GWAS) 基因座以及重叠的表达和剪接定量性状基因座(e/sQTLs)进行共定位和孟德尔随机化分析,为 60% 的基因座筛选出了因果基因。
所以题目中的“single-cell”并非真正意义上的单细胞数据,而是整合了GTEx中49种组织和EyeGEx视网膜组织的e/sQTL数据。
文章的数据分析量可以用“庞大”来形容,所以作者提供了Shell脚本命令,用于通过qsub命令将一个名为wrap_manifest.sh
的脚本提交到集群作业调度系统中运行。【遗憾的是俺还不太会sh脚本,所以没办法批量化处理太多数据……】
还是来看看MR的部分作者是咋做的——
这部分的方法学写得很清晰,相对之前BMJ的那篇显得言简意赅,但两篇文章的MR部分有异曲同工之妙,值得关联学习参考。
文章产生了非常丰富的数据分析结果,可以在https://VisionGenomics.org这里详细去看。
MR部分的代码在这里:https://github.com/segrelabgenomics/ TwoSampleMR_pipeline
其中,MR部分的核心代码就是框红的部分,有余力的话可以结合下面的sh命令一起学习:
qsub MR/src/wrap_manifest.sh IOP ENSG00000100116.16 GCAT Cells_Cultured_fibroblasts eQTL 0.000005 /Path/GWAS.txt MR/data/GTEx_v8_eQTL/ .v8.signif_variant_gene_pairs.txt.gz
qsub MR/src/wrap_manifest.sh POAG_EUR chr22:37808163:37809949:clu_24295:ENSG00000100116.16 GCAT Artery_Coronary sQTL 0.000005 Path/GWAS.txt MR/data/GTEx_v8_sQTL/ .v8.sqtl_signifpairs.txt.gz
这里POAG_EUR
的gwas数据可以从[GWAS Catalog https://www.ebi.ac.uk/gwas/studies/GCST90011766]下载,以GCAT
基因为例先练习看看,多跑几遍,对比一下药靶MR分析(做药靶大概率离不开GTEx的eQTL数据),直接用eQTL数据做MR,又何尝不可呢?