通常我们讲解GEO数据挖掘,指的是表达芯片数据处理,其中一个难点就是芯片设计的探针跟我们感兴趣的基因的对应关系,之所以说它是难点,就是背景知识太多,初学者无从了解。
而且部分芯片,使用的人就非常少,你想学习前人的数据分析策略, 都很难,你应该是会很奔溃吧,比如我们之前介绍过的 [HuGene-2_0-st] Affymetrix Human Gene 2.0 ST Array [probe set (exon) version] 是affy公司非常新的一款产品,全世界就15个发表的研究:
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL19251
image-20191022114447799
丰富的基因涵盖度以及深度的探针覆盖,完成编码RNA、长片段非编码RNA(lncRNA)及可变剪切方面的应用。
极高的探针覆盖度:
看到文章,包含在可变剪切方面,长链非编码RNA研究方面,以及在表达谱差异化基因研究方面:
其实也没有什么好办法,怎么可能会有人是什么数据都会分析呢?我们能教的,大家应该学的,其实主要是学习方法,每个人都会有自己的困难,自己的困难别人是无法替你克服的!
但是呢,这15篇文章你都不去看,我就只能骂你了!