转录组测序常见问题整理

文章来源：企鹅号 - VG生信软件

转录组测序结果与qPCR验证结果不一致，Why？

两种方法本就不同，RNA-seq是大规模筛选用的，反应样本整体的基因表达变化趋势，无法保证每个基因的变化趋势都与qPCR一致。存在一定量的不一致也属正常

实验样本搞反

挑选的基因表达差异不显著，或挑选的是差异基因但表达量较低

没有使用与RNA-seq同一批样本进行验证

真核de novo转录组项目，想挑选差异表达基因做验证，是优先考虑差异倍数大的基因还是在六大数据库中均有注释信息的基因？

注释到的基因数与研究物种及选用的数据库有关，现有数据库中关于该物种及其相近物种的注释信息越全，则注释率也会越高。

NR数据库作为NCBI主要数据库之一，库容较大，能注释到较多的基因，但注释到的基因中未验证的信息也较多，且很多基因功能描述模糊，会影响我们对基因功能的辨识。因此，结合其他数据库注释结果综合考量更为妥当。验证实验需结合具体的生物学意义。

差异基因较多时，可通过功能注释缩小筛选范围，且挑选差异倍数大、表达量较高的基因来验证，成功率会较高。

能否只提取脂肪代谢相关的基因的部分基因做差异分析？

差异分析是基于整体来做，要用全部read count进行差异分析。

若提取部分基因做分析，会破坏数据的整体性，如reads分布特征、测序深度等，所以不建议提取部分基因做差异分析。

某基因在两个样本中表达量差异很大，分析结果却是非显著差异基因，为什么？

差异基因的筛选基于统计学，不能仅通过某个基因在两个样本中表达量数值的大小，判断差异表达是否显著。

差异显著情况可通过矫正后的p-value来看，矫正后的p-value越小，差异越显著。

也可结合|log2Foldchange|值来判断差异的大小，|log2Foldchange|越大，差异倍数越大。

RNA-seq分析中几种表达量计算方法有何不同？

FPKM

与RPKM极为相近。区别仅在于Fragments与Reads。

RPKM主要针对早期的单端（SE）测序，FPKM是在双端（PE）测序上对RPKM的校正。

Reads是测序数据中的每一条Reads，Fragments是每一段用于测序的核酸片段（建库时打断获得）。

RPKM

为每百万Reads中，每个基因以一千个碱基为单位，比对上的Reads数。

计算公式：RPKM=(1000000*C)/(N*L/1000)

（C 为比对到gene A的reads数，N为比对到所有gene的总reads数，L为gene A的碱基数。）

RPKM法能消除基因长度和测序量差异对基因表达量计算的影响，计算得到的基因表达量，可直接用于比较不同样品间的基因表达差异。

TPM

即每百万reads中来源于某转录本的读段数。

TPM和FPKM相同点：都对基因长度和测序深度进行了均一化。

TPM和FPKM不同点：FPKM是先对测序深度进行均一化，再对基因长度进行均一化；TPM恰好相反，它的均一化过程使得不同样本中的总表达量一致。这样，能更直观地进行表达量的比较。

又是一年腊八时，过了腊月就是年，VG 祝大家腊八快乐，愿新的一年诸事顺顺利利。

腊八的祝福

发表于: 2018-01-242018-01-24 17:32:45
原文链接：http://kuaibao.qq.com/s/20180124B0N58Q00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

转录组测序常见问题整理

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐