首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

教你如何预测参与调节差异基因的转录因子

KnockTF(http://www.licpathway.net/KnockTF/search.php)数据库就是基于这个目的构建的数据库。关于这个数据库,我在很久前的文章【这个网站提供了多种数据分析工具——增强子,非编码RNA转录信息等】中有提到,这个数据库收录了目前公共数据库当中敲减该转录因子后做的表达谱(芯片、二代测序)的数据,进而来反映这个转录因子变化后对于基因表达的影响。KnockTF不仅提供了感兴趣的TFs靶基因的全面基因表达信息,还收集了TFs上游通路信息以及下游靶基因的各种功能注释和分析结果,包括GSEA、GO富集、KEGG通路富集、层次聚类分析和差异表达分析。KnockTF进一步提供了有关TFs与启动子、超级增强子和靶基因典型增强子结合的详细信息。构建TF差异表达基因网络,对感兴趣的基因集进行网络分析,如子网络定位、拓扑分析和超几何富集。KnockTF将有助于阐明TF相关功能并挖掘潜在的生物学效应。

02

对差异表达基因执行转录因子富集分析

我们获得的差异基因【学习:一文就会TCGA数据库基因表达差异分析,GEO数据库表达数据的提取以及limma包进行差异分析,TCGA数据库:GDCRNATools包下载数据、处理数据以及差异分析】,下游除了富集分析【学习:clusterProfiler包进行KEGG,GO,GSEA富集分析;FunRich数据库:一个主要用于基因和蛋白质的功能富集以及相互作用网络分析的独立的软件工具】等以外,如果我们想找到参与调控这些差异基因的转录因子,作为研究的上游机制,是一个思路。而很多转录因子预测的数据库是基于转录因子的Chip-seq的数据来进行构建的,这样的结果能说明某一个转录因子结合某一段序列,但是结合并不一定说明可能影响这个基因的表达,所以最好做一个这个转录因子导入/导出的表达数据来说明对于基因表达的影响。

01

基因总体预后没意义就真的没意义了嘛

我们在研究基因对于某一个疾病预后是否有影响的时候。最直接的就是单纯的做这个基因对所有患者的预后分析。如果预后有意义,就说明这个基因影响疾病的预后。如果没有意义就说明这个基因不重要的嘛?当然也不是的。疾病的发展是一个多基因多因素相互影响的结果。如果这个基因对于所有患者预后没意义的话,有可能这个基因在某些药物治疗下可能就影响预后了,或者说这个基因和另外一个基因存在相互作用关系。在另外一个基因激活的情况话,这个基因就影响预后了。因此,我们在发现一个基因对于预后没有意义的时候,也不能说这个基因没意义了,可以继续尝试做一些进一步交互性的分析。

01

VThunter | 基于单细胞测序的病毒受体基因表达数据库

[[单细胞测序]] 作为一个特别特别已经火上天的测序技术。之前所有在 bulk RNA-seq 上面分析的内容。基本上可以在 scRNA-seq 上面重新来一遍。对于一些在线的数据库也是这样的。我们在研究肿瘤的时候,之前可能只是基于单纯的 RNA-seq 来看一下基因的表达,例如 [[GEPIA2-TCGA表达分析数据库]],但是 scRNA-seq 的增多之后,就会有了 [[CancerSCEM-肿瘤单细胞基因表达图谱]] 这样在单细胞水平看基因的表达情况。 同样在病毒感染方面,之前也有预测病毒感觉的受体在不同组织当中的表达情况的数据库,那么单细胞数据多了之后也就有了 VThunter: https://db.cngb.org/VThunter/VThunter/index 。这个基于单细胞测序观察不同物种当中病毒受体表达情况的数据库。

02

为什么选择GSEA分析?和KEGG和GO分析有什么区别?

但是,一般的差异分析(GO和Pathway)往往侧重于比较两组间的基因表达差异,集中关注少数几个显著上调或下调的基因,这容易遗漏部分差异表达不显著却有重要生物学意义的基因,忽略一些基因的生物特性、基因调控网络之间的关系及基因功能和意义等有价值的信息。而GSEA不需要指定明确的差异基因阈值,算法会根据实际数据的整体趋势, 为研究者们提供了一种合理地解决目前芯片分析瓶颈问题的方法,即使在没有先验经验存在的情况下也能在表达谱整体层次上对数条基因进行分析,从而从数理统计上把表达谱芯片数据与生物学意义很好地衔接起来,使得研究者们能够更轻松、更合理地解读芯片结果。

06

人类长非编码RNA表达数据库,整合9种重要生物学场景(发育、癌症、病毒侵染等)

近日,由中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心开发的人类长非编码RNA(long non-coding RNA, lncRNA)表达数据库正式上线。该研究成果以`LncExpDB: an expression database of human long non-coding RNAs`为题在国际学术期刊《核酸研究》(`Nucleic Acids Research`)在线发表。 `LncRNA`通过复杂多样的分子机制发挥重要调控功能,在多个生物学过程以及疾病发生发展中均发挥重要作用。目前,人类基因组中已鉴定出十万多个lncRNA基因,但有功能研究的仅有数千条,因此全面注释lncRNA功能是人类基因组研究的重要内容和巨大挑战。近年来,高通量测序技术的迅速发展促进了正常组织、疾病、胚胎发育、器官分化、病毒侵染、亚细胞区室等多种生物学场景的研究,积累了丰富的组学数据,尤其是转录组测序数据,为从多角度发现和研究lncRNA的生物学功能提供了重要的数据基础与研究思路。 LncExpDB数据库致力于提供多生物学场景的lncRNA表达谱,鉴定具有潜在功能的lncRNA,促进lncRNA的功能实验研究。在LncBook数据库构建的人类lncRNA数据集基础上,研究人员整合CHESS、RefLnc、FANTOM等10余个专业数据库鉴定的lncRNA,基于严格审编标准,获得全面的高质量人类lncRNA参考数据集,包含101,293个基因/33,1244个转录本。LncExpDB数据库进一步整合9种重要生物学场景(正常组织/细胞系、器官发育、植入前胚胎发育、细胞分化、亚细胞定位、外泌体、癌症细胞系、病毒侵染、昼夜节律)的1,977个样本的转录组数据,通过标准化的转录组数据分析流程,系统分析并鉴定每种生物学场景的特征基因(管家基因/组织特异性基因、差异表达基因、节律基因、动态表达基因、亚细胞区室富集基因)集合,共计25,191个特征lncRNA基因和28,443,865对相关的lncRNA-mRNA共表达关系。此外,LncExpDB鉴定了具有表达证据支持的92,016个lncRNA基因,评估了lncRNA的表达水平与表达潜力。

01
领券