昨天我们diss了肿瘤外显子技术,很容易设计课题,任意肿瘤对象招募病人集齐样品送给公司进行肿瘤外显子测序即可,公司一般来说也会给出来somatic突变信息,包括SNV和CNV,甚至给出来发表级别的图表。详见:几乎不提供任何有用信息的肿瘤外显子你还做吗
实际上更应该diss的应该是单细胞技术,早期大家也是任意肿瘤对象招募病人集齐样品送给公司进行单细胞转录组,就是一个全新的 图谱研究,划时代的意义。中期就需要选择不同分级分期或者不同亚型的肿瘤或者不同疾病进展阶段的样品去试图找关键细胞亚群,晚期就更卷了,各种治疗前后各种复杂样品组成都需要慢慢的探索。而实际上这样的实验设计并没有任何新颖之处,都是两百年前老一辈生物学家玩剩下的的,唯一的创新点就是单细胞转录组技术,新瓶装旧酒。。。。
但是, 如果你手上还有的就是这样的朴实无华实验设计下的单细胞转录组,或者你时至今日还想着去单细胞转录组领域分一杯羹,我劝你还是放弃了,还不如选择小众技术做同样的课题(事半功倍),比如2022的文章:《CAMTA1 gene affects the ischemia-reperfusion injury by regulating CCND1》
只需要一个简单的2分组甲基化芯片差异即可:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE197080
GSM5908184 genomic DNA from healthy people 1 [ZXJ]
GSM5908185 genomic DNA from healthy people 2 [YXG]
GSM5908186 genomic DNA from healthy people 3 [ZSS]
GSM5908187 genomic DNA from ischemic stroke patients 1 [RWH]
GSM5908188 genomic DNA from ischemic stroke patients 2 [HM]
GSM5908189 genomic DNA from ischemic stroke patients 3 [ZM]
首先就是差异分析,然后从成百上千个差异位点里面挑选最重要的,然后再次纳入病人作为验证队列,这样的课题就结束了:
因为是朴实无华的差异分析,所以展现差异分析后的热图即可:
差异分析后的热图
当然了,因为作者定位到了CAMTA1这个基因 ,因为 CAMTA1 gene was the most highly methylated in patients compared to the controls.
所以又顺理成章做了一个转录组测序数据(RNA seq in wild-type and CAMTA1 KO cells),RNA seq in CAMTA1 KO SH-SY5Y以及HEK293T两个细胞系 ,也是很简单的差异分析+富集分析啦。
这个文章的数据有点多,GSE197080, GSE197081, and GSE205687,但是都是很容易理解的。
甲基化技术里面,whole-genome bisulfite conversion (WGBS) 是金标准,但是价格昂贵,数据处理消耗计算资源,而Reduced- representation bisulfite sequencing (RRBS) 和Methylated DNA Immunoprecipitation Sequencing (MeDIP-Seq),都是片面的,只有 MC Seq 克服了它们其它这些技术的缺点:
首先需要阅读我在生信技能树的甲基化系列教程,目录如下:
然后就可以看我在B站免费分享的视频课程《甲基化芯片(450K或者850K)数据处理 》
值得一提的是,现在甲基化芯片850K也升级为了935k,如果大家要选择这方面小众技术,就需要擦亮眼睛了哈, 因为小众所以很难找的好口碑或者说很难沟通到擅长这方面科研服务的公司。。。
比如甘肃农业大学的课题组,选取了健康奶牛(C组)和患乳腺炎奶牛的乳腺组织(HM组)然后进行蛋白质组后看差异,在Frontiers in Veterinary Science、Animals、International Journal of Molecular Sciences、Antioxidants、International Journal of Molecular Sciences上连发5篇文章。。。。
虽然是同一个数据集,蛋白质组定量和差异分析,通过设置参数FC>1.50、FDR<0.05,总共筛选出3739个差异富集蛋白(DEPs),其中2718个DEPs显著上调,1021个DEPs显著下调。
但是针对差异富集蛋白(DEPs)的解释,也就是生物学功能数据库注释(富集到GO和KEGG数据库中进行功能注释)后作者在不同的机制层面做文章:
当然了,这个缺点对绝大部分小伙伴来说都不是事情,因为对大家来说终其一生发CNS的可能性微乎其微了。但是对很多国际大计划来说,cns就跟大白菜一样的批发,比如TCGA计划,GTEX计划, 还有最近(2023年07月)的人类生物分子图谱计划(Human BioMolecular Atlas Program,HuBMAP),利用单细胞RNA测序、质谱分析、空间转录组学三维成像和人工智能等技术,对细胞结构进行了多维度观察。一下子就解析了肠道、肾脏与胎盘三个器官的单细胞与空间图谱,9篇齐发,Nature封面刊登。。。。
除了转录组、基因组、蛋白质组和代谢组,还有一些偏小众的生物信息学数据产出技术,它们在特定研究领域或特殊实验设计中发挥着重要的作用。以下是一些偏小众的生物信息学数据产出技术: