哈喽,我是学习生物信息学的阿榜!非常感谢您能够点击进来查看我的笔记。我致力于通过笔记,将生物信息学知识分享给更多的人。如果有任何纰漏或谬误,欢迎指正。让我们一起加油,一起学习进步鸭🦆
一、实验目的:通过基因表达量数据的差异分析和富集分析来解释生物学现象
病变组织vs健康组织
药物处理vs对照组
开花前vs开花后
动物/动物不同发育期
高产/低产品种
思路:有差异的材料→差异基因→找功能/找关联→解释差异,缩小基因范围
二、明白三个概念
GPL:用户测序使用的芯片/平台;
GSM:用户提交给GEO的样本数据;
GSE:一个完整的研究,并提供了整个研究的描述,包括对数据的描述,总结分析。
三、分析思路
①、先去GEO数据库找到GSE编号
②、下载数据(如表达矩阵、GPL平台注释文件等)
③、探索分组之间是否有差异,PCA、热图等
④、差异分析及可视化
⑤、富集分析KEGG、GO
四、探针的注释
五、问题数据和常见错误分析
下图列举一些常见错误分析,大家遇到相同的问题后可以“对号入座”。
以上是我这次在学习生物信息学过程中所整理的笔记。如果大家对这个领域也感兴趣,欢迎加我好友,我的qq号是1841113542。希望大家能够一起学习,共同进步。如果在笔记中有错误或者不足之处,欢迎大家指正,我们一起加油鸭🦆
引用自生信技能树——小洁老师
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。