前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >什么鬼,你才60秒?

什么鬼,你才60秒?

作者头像
生信技能树
发布2021-11-04 14:18:29
1.6K0
发布2021-11-04 14:18:29
举报
文章被收录于专栏:生信技能树

最近很多小伙伴表示,在使用R语言下载GEO数据集,或者其它文件,会遇到时间不够的情况,比如如下所示的报错:

代码语言:javascript
复制
In download.file(url, destfile, method, mode = "wb", ...) :
  URL 'https://seurat.nygenome.org/src/contrib/pbmc3k.SeuratData_3.1.4.tar.gz': Timeout of 60 seconds was reached

其实就是全局变量utils::download.file() in R 里面,默认它仅仅是给你60秒的时间去下载文件。

一个很简单的解决方案就是 options(timeout=10000) :

代码语言:javascript
复制
# install.packages('devtools')
# devtools::install_github('satijalab/seurat-data')
library(SeuratData)  
getOption('timeout')
options(timeout=10000)
InstallData("pbmc3k")  
data("pbmc3k")   

这样,哪怕你的网络再差,也是可以慢慢等待,虽然耗时会很长,但是至少可以成功了。

参考:

  • https://stat.ethz.ch/R-manual/R-patched/library/base/html/Startup.html
  • https://stat.ethz.ch/R-manual/R-patched/library/base/html/options.html
  • http://endmemo.com/r/options.php

其实,如果是geo数据集,如果你使用默认的方式下载很慢,我们也提供了一个加速通道哦!(一般来说,60秒已经是绰绰有余)

代码语言:javascript
复制
rm(list = ls())
library(AnnoProbe)
# 获取表达量矩阵
gse_number <- 'GSE14762'
gset <- geoChina(gse_number)
## file downloaded in /Users/teemo/Documents/bioinfo/Apprentice_202106_/01_GEO_202106_/task/05_GSE14762_rmd_opt
## you can also use getGEO from GEOquery, by 
## getGEO('GSE14762', destdir=".", AnnotGPL = F, getGPL = F)
a=gset[[1]] 
dat=exprs(a) 
dim(dat)
## [1] 17232    22
# 检查,判断需不需要取log
dat[1:4,1:4] 
##    GSM368639 GSM368640 GSM368641 GSM368642
## 1      5.279     5.494     5.347     5.666
## 2     11.844    12.801    12.545    12.497
## 9      7.506     7.431     6.675     7.332
## 10     6.238     6.951     6.076     6.269

有了表达量矩阵,后续分析,就理所当然啦!

但是,如果你下载表达量矩阵发现搞不定,仍然是需要下载cel文件,就最好是不要使用r代码来下载了,直接去geo主页面浏览器点击下载,比如自己下载 GSE18997 :

代码语言:javascript
复制
library(oligo)
library(ggplot2) 
celFiles <- list.celfiles('GSE18997_RAW/',listGzipped = T,
                          full.name=TRUE)
celFiles
exon_data <- oligo::read.celfiles( celFiles ) 
dim(exprs(exon_data)) 
exprs(exon_data)[1:4,1:4]
### 标准化(一步完成背景校正、分位数校正标准化和RMA (robust multichip average) 表达整合)
exon_data_rma <- oligo::rma(exon_data  ) 
exp_probe <- Biobase::exprs(exon_data_rma)
exp_probe[1:4,1:4]
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-10-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档