腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
GEO数据挖掘
R语言进行数据挖掘
专栏成员
举报
19
文章
2847
阅读量
14
订阅数
订阅专栏
申请加入专栏
全部文章(19)
数据挖掘(15)
生物基因(4)
geo(2)
搜索文章
搜索
搜索
关闭
数据挖掘—疾病靶点获取、批量读取差异基因以及Reduce函数的使用
生物基因
获取疾病相关靶点,除了从genecard、omim、disgnet等疾病数据库中搜索,还可以在GEO数据库中检索相关疾病看有无合适的数据集使用。这里记录下在GEO数据库中获取靶点的相关操作。
sheldor没耳朵
2024-10-18
7
0
转录组—多分组的差异基因的聚类分析
生物基因
这次的需求是将以下这张图(全部分组差异基因聚类),去除control组之后重新聚类。并且EGA分组改为Model+TreatA、EGB分组改为Model+TreatB。
sheldor没耳朵
2024-10-18
11
0
GEO—芯片GSE3292 _pd 中无法找到分组信息—火山图中添加目标基因
geo
采用的数据集是GSE3292,2005年发表的基于芯片的转录组测序数据,按照常规方法导入即可
sheldor没耳朵
2024-10-07
68
0
转录组—上游分析GSE232120_微生物物种__NCBI下载参考基因组
生物基因
本次实战的是Hosts Manipulate Lifestyle Switch and Pathogenicity Heterogeneity of Opportunistic Pathogens in the Single-cell Resolution这篇文章。这不是常见的人类或小鼠物种,而是微生物,在上下游处理的过程中与人类或小鼠有所差异。其次我习惯于在ensembl上下载基因组及注释文件,所以首先在这里面查找,但是未找到Serratia marcescens这个物种。本次从NCBI中下载参考基因组及其注释文件。
sheldor没耳朵
2024-09-07
85
0
转录组GSE105789_小鼠数据下游分析注意事项
数据挖掘
简单记录下GSE105789小鼠数据的下游分析的主要事项,与human的数据分析的主要区别是在进行id转换、kegg、go、gsea时,需要注意数据库和物种信息,应该选择小鼠。
sheldor没耳朵
2024-08-21
148
0
转录组上游分析—使用iseq下载原始数据、小鼠基因组、单端测序数据处理
数据挖掘
生物基因
进行数据集GSE105789上游分析的时候,总共才四个数据集,使用prefetch下载的时候,不知道网络抽了什么风,速度一直都很慢。下了10个小时才下了三分之一。!
sheldor没耳朵
2024-08-21
179
0
转录组-样品表达总体分布及质控可视化
数据挖掘
在拿到表达矩阵时我们常常会对其基因表达的总体分布(可选),以及质量控制进行可视化(必须)。这里总结记录相关代码。
sheldor没耳朵
2024-08-14
100
0
转录组—上游分析_如何拿到count矩阵
数据挖掘
本文档记录GSE149638数据集中下载SRR11652578和SRR11652615原始数据
sheldor没耳朵
2024-08-12
168
0
转录组分析—再谈GSEA
数据挖掘
Gene Set Enrichment Analysis (GSEA) 是一种生物信息学方法,用于确定基因集合(gene sets)在基因表达数据中的显著性变化。它广泛应用于基因表达数据的功能解释,帮助研究者理解在特定实验条件下哪些生物学通路或功能类别是活跃的。以下是GSEA的相关知识点:
sheldor没耳朵
2024-08-05
104
0
转录组GSE122709—KEGG 富集不出?
数据挖掘
在分析GSE122709时候,取D1组、D2组分别与NC组进行基因差异与富集的分析时候,遇到一个问题就是D2/NC比较,进行KEGG分析时候什么结果都没有。查找原因时候遇到了一些问题,这里做简单的记录。
sheldor没耳朵
2024-08-02
180
0
转录组GSE157718_Tpm与Count差异分析的比较
数据挖掘
在尝试复现GSE157718数据集的时候,发现网站同时提供了表达矩阵tpm形式与count形式,因此分别用这两种形式进行基因差异与富集分析,再进行对比。
sheldor没耳朵
2024-08-01
164
0
转录组分析—GSE200033二分组(去除异常值Vs未去除)
数据挖掘
直接从GEO官网下载表达矩阵,临床信息表格(存放在Series Matrix File中),放在工作目录下;
sheldor没耳朵
2024-07-31
105
0
转录组差异分析—基本流程
数据挖掘
读取RawCounts.csv文件,其文件形式如下图行名为ensembleid,列名为样本名称。
sheldor没耳朵
2024-07-29
137
0
GEO_加权共表达网络WGCNA
数据挖掘
WGCNA(Weighted Gene Co-Expression Network Analysis,即加权基因共表达网络分析)是一种用于分析基因表达数据的系统生物学方法。WGCNA的主要目的是识别基因表达数据中的共表达模块,并研究这些模块与外部样本特征(例如,疾病状态、临床特征等)之间的关系。
sheldor没耳朵
2024-07-25
184
0
GEO_多组数据联合分析(去除批次效应)
数据挖掘
有的时候我们需要用多组数据(来自不同GSM)联合进行分析,或者批次效应较为明显,应该进行去除批次效应的操作。
sheldor没耳朵
2024-07-25
680
0
GEO数据挖掘—GSE5883(基于时间序列)
数据挖掘
之前把GSE5883数据集按照普通二分组进行分析的,参考GEO数据挖掘-GSE5883
sheldor没耳朵
2024-07-24
113
0
GEO数据挖掘—GSE5883
数据挖掘
(做这个演练时,虽然实现了目的,但是觉得我的代码very垃圾冗余,希望后续可以找到更好的办法)
sheldor没耳朵
2024-07-23
96
0
GEO数据挖掘—GSE68183
数据挖掘
首先注意到信息表格pd中的title与source_name_ch1列中均含有分组信息,这里我选择了source_name_ch1l列,non-Diabetic Foot skin作为对照,Diabetic Foot skinDFU作为处理组。
sheldor没耳朵
2024-07-23
155
0
GEO数据挖掘-基于芯片
数据挖掘
geo
在require()函数中,如果直接传递包的名称作为参数,不需要加引号;如果包的名称以字符串形式存储在变量中,则需要使用character.only = TRUE来指定这个变量是一个字符串
sheldor没耳朵
2024-07-23
163
0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档