生信论文的套路
在芯片、测序和组学等遍地开花的时代,前人已经积累了大量数据,而且信息是公开的、免费的。因此,如果我们用别人的数据发表自己的论文,从海量数据中挖掘点自己需要的东西,岂不是件很赚的事情。
具体到医学生物科研,生信分析越来越成为科研工作者必备的技能。我觉得生信分析的大方向可以分为三个:差异分析,功能分析和临床意义探索。
差异分析是所有研究的前提,无论是细胞实验、动物模型,还是临床标本,有差异都是必须的,而且我们还给差异规定了标准,p<0.05(或者更小)。目前,很多数据库可以做差异分析,从mRNA、protein到DNA都有。因为蛋白是功能的执行者,因此是做差异分析的首选。
oncomine数据库总结几乎所有肿瘤的数据,mRNA水平研究差异。全景式观察某基因在所有肿瘤的表达情况。GEPIA、UALCAN可进一步验证表达差异,数据可视化,简单方便易上手,mRNA水平研究差异。TIMER数据库对单基因的差异分析,尤其是与肿瘤浸润免疫细胞表型相关的分析,特别适用,可以做到统筹兼顾,有局部聚焦(oncomine)和全局通览(TIMER)的神奇效果。不过,在做多基因或者家族基因分析的时候,是选择oncomine+GEPIA双验证模式,而是选择oncomine+TIMER双验证,可以具体问题具体分析。
转录水平的验证,首选PCR/RT-PCT;蛋白水平的验证,首选Western Blot。我们先介绍转录水平的验证。
-------------PCR技术(Polymerase chain reaction)-------------
模板、引物和四种dNTP存在下依赖于DNA聚合酶的酶促反应。
反应分三步:
变性:通过加热使DNA双螺旋的氢键断裂,形成单链DNA。
退火:将反应混合液冷却至某一温度,使引物与模板结合。
延伸:在DNA聚合酶和dNTPs及Mg2+存在下,退火引物沿5‘- 3’方向延伸。
以上三步为一个循环,反复进行。
PCR一般以cDNA或质粒为模板,但是有时会以基因组为模板,比如小鼠基因型鉴定和基因编辑效果验证。
在做genotyping或者基因编辑时,我们需要用真核细胞的基因组做PCR,那么,提取质粒的试剂盒可以用来提取细胞基因组吗?这是我最近才完全搞明确的事情。
肯定是不行的,因为原理不同。质粒提取试剂盒获得的是大肠杆菌基因组以外的DNA,也就是质粒。其原理一般是碱变性提取质粒DNA。碱变性提取质粒DNA是基于染色体DNA与质粒DNA的变性与复性的差异而达到分离目的。在pH高达12.6的碱性条件下,染色体DNA的氢键断裂,双螺旋结构解开而变性。质粒DNA的大部分氢键也断裂,但超螺旋共价闭合环状的两条互补链不会完全分离,当以pH4.8的NaAc高盐缓冲液去调节其pH至中性时,变性的质粒DNA又恢复原来的构型,保存在溶液中,而染色体DNA不能复性而形成缠连的网状结构,通过离心,染色体DNA与不稳定的大分子RNA、蛋白质-SDS复合物等一起沉淀下来而被除去。
使用质粒抽提试剂盒,恰恰是把基因组去除了。
----------------------逆转录酶和RT-PCR---------------------
我们在验证肿瘤组织与正常对照转录水平差异时,是从mRNA角度去检测差异表达的,并不是从基因组DNA角度去做的。因此,依据中心法则和PCR原理,首先要完成RNA→DNA的逆转录。
RT-PCR是将RNA的逆转录(RT)和cDNA的聚合酶链式扩增(PCR)相结合的技术。首先经逆转录酶的作用从RNA合成cDNA,再以cDNA为模板,扩增合成目的片段。实验步骤包括RNA提取;逆转录合成cDNA;PCR扩增;产物电泳和结果测定。
逆转录酶是存在于RNA病毒的DNA聚合酶,至少具有以下三种活性:
(1)依赖RNA的DNA聚合酶活性:以RNA为模板合成cDNA第一条链;
(2)RNA水解活性:水解RNA:DNA杂合体中的RNA;
(3)依赖DNA的DNA聚合酶活性:以第一条DNA链为模板合成互补的cDNA。
具体操作网上有很多介绍,但是实施过程中有很多讲究,这里很难一一道明,若有机会,芒果一定录制视频,跟果友们分享。关键就是做好protocol,每一步确认,用最少的步骤完成。
分子实验,每一步都是关键,因为PCR反应是指数扩增的,一倍的误差,可能是千倍的差别。
大致流程如下(分享自lab易公众号)。