专栏首页生信技能树SRA数据库的数据并不一定要在SRA数据库下载

SRA数据库的数据并不一定要在SRA数据库下载

1

导读

在GEO下载测序数据,首先要找到GSE号,然后找到SRR号,最后prefetch就0K了!

但是路走多了什么样的坑都容易遇到,比如下面这个:

2

任务

首先,我需要下载一个数据集SRP058243,我想这还不简单吗,直接就有就顺着思路去找到了每个样本的SRR号

一来就是prefetch, 结果就悲催了,满屏的下载失败。

3

探索一下失败原因

报错怎么办?肯定得搜索呀

经过搜索我就知道了,嘿嘿,原来我们用prefech下载的数据都在https://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/可以找到,但是我发现这里面的数据是没有我要下载的SRR,此时想起了,jimmy老师说的“敲命令不是随便乱敲的,它存在我们才写”,其实下载数据同样如此,你下载的数据的地方要有你的数据你才可以下载,数据都没有你下载个啥呢,虽然有的软件很方便像conda,prefetch,但我们同样需要对他们所做的事有所了解,这样才能避免报错的时候,一脸懵逼。

知道了是数据缺失了之后,菜鸟的我自觉得这是一个无法被解决的问题?数据都没了,我能做个啥啊,对吧。

4

求助老师

然后我就发邮件跟jimmy大神汇报这个问题,很快,他就发了我两个地址:SRP058243在DRA,ERA的位置。

5

继续探索

然后我也搜索了一下,这两个应该也是存放数据的地方类似于SRA, 找到地址了,接下来肯定是下载起来啦(大神一句话,菜鸟跑半年,这句话还是有道理的)

有链接地址,还想啥,wget啊,但是看到下面的网速可能你会崩溃

prefetch好像又不行,只剩下ascp啦,接下来就行自己上网搜索ascp如何实现ERA快速下载

一看网速还行,但是我不可能一个一个下吧,四十多个我得做四十多遍,四百多个我不就炸了

这时候jimmy老师经常强调的要善于观察url的规律涌上了心头,那我就复制几个看看

还真有规律,但是你让我用代码把他写出来,可能不太现实,但是笨人总有笨办法(毕竟是能把B站GEO代码,一个字一个字抄下来的傻逼,还怕这个),直接用excel做好,然后写个循环就可以坐等数据了。

6

结语

所以呢,这个问题说简单也简单,但是前提是你对这些数据库有足够的了解。

本文分享自微信公众号 - 生信技能树(biotrainee),作者:养乐多

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-10-21

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 北京基因组所数据库介绍(类似sra和ebi)

    基因组学在生物学科的发展中,具有划时代的意义。同时,很多人在刚进入生物信息学领域时,最先接触的也往往是组装基因组,注释基因组。这在我们生信技能树的公号里有详细的...

    生信技能树
  • 文章测序数据下载碰到的问题的小总结(南京站学员分享)

    全国巡讲南京站过去还不到一周,学员们课后练习都很拼,微信群答疑对话一不留神就几百条了,爱学习的你是最美丽的!

    生信技能树
  • nature杂志给你的生物信息学数据处理11个小技巧

    nature杂志的TECHNOLOGY FEATURE 栏目在13 JANUARY 2020发表了一个有趣的小短文:Eleven tips for workin...

    生信技能树
  • 谈一谈越来越难做的前端

    我接触前端的时间不长也不短,13 年入门,14 年初在百度实习,14 中正式参加工作,掐指一算 4 年整。然而这四年间前端的变化已经让很多人摸不着头脑。   昨...

    用户1667431
  • AJAX应用【股票案例、验证码校验】

    股票案例 我们要做的是股票的案例,它能够无刷新地更新股票的数据。当鼠标移动到具体的股票中,它会显示具体的信息。 我们首先来看一下要做出来的效果: ? 服务器端分...

    Java3y
  • (修订版)AJAX应用!

    我们要做的是股票的案例,它能够无刷新地更新股票的数据。当鼠标移动到具体的股票中,它会显示具体的信息。

    Java3y
  • 大数据与商业的未来

    信息乃是企业的根本,几千年以来都是如此。 但是认为大数据只不过是信息发展的延续可就大错特错了。 时至今日我们获取的信息比以往任何时候都多,信息的重要性却超出了仅...

    CSDN技术头条
  • 解密《长安十二时辰》之数据“黑科技”丨Informatica微电台

    本期Informatica微电台邀请到了Informatica中国区销售总经理李晨为我们揭示《长安十二时辰》的“硬核黑科技”,解密“古代大数据中心”靖安司——

    数据猿
  • 升值加薪Excel神助攻,数据透视表堪称神器!

    VLOOKUP、数据透视表、条件格式…你用这几个技巧做,80%的工作需求都能解决。今天特意整理了这些操作技巧,拯救同在“表海”中挣扎的你,让你的工作效率超乎想...

    华章科技
  • 单日处理8亿个包裹,他说这是大数据的骄傲 | 数据科学50人•丁宏伟

    如今,我们每个人都在谈论“数据科学”,《哈佛商业评论》甚至将数据科学家定义为“21世纪最性感的职业”。在这个大数据时代,究竟什么是数据科学?数据科学家又究竟是怎...

    DT数据侠

扫码关注云+社区

领取腾讯云代金券