前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >如何在NCBI中下载SRA数据?

如何在NCBI中下载SRA数据?

作者头像
作图丫
发布2022-03-29 14:48:15
2.5K0
发布2022-03-29 14:48:15
举报
文章被收录于专栏:作图丫

导语

GUIDE ╲

背景介绍

假设我们现在有一个样本号“IRIS_313-11156”,想下载该样本的所有SRA数据(注意:一个样本的SRA数据可能分不同次run上机)。

目前,在NCBI中下载SRA数据主要有三种方式:

  • 利用Aspera工具下载。
  • 利用SRA Toolkit下载。
  • 利用wget命令直接下载。

小编的个人经验:第一种Aspera工具在批量下载时偶尔会出错。第二种SRA Toolkit的prefetch命令下载,只能将数据下载到home目录下。关于前两种方法网上有很多详细的介绍,感兴趣的朋友们可以自行搜索,我们今天主要来介绍第三种wget命令的方式,这种方法的关键是找到SRA数据对应的ftp地址。

获取ftp地址

进入NCBI网页后,按如下步骤操作:

  • Step1.设置NCBI的分类为:SRA
  • Step2.输入感兴趣的样本号:IRIS_313-11156,点击Search,弹出四条item,说明该样本分四次run上级,我们需要全部下载
  • Step3.点击右上角的Send to
  • Step4.在Choose Destination中选择File
  • Step5.在Format输入栏选择RunInfo
  • Step6.点击Create File,此刻会生成一个名为SraRunInfo.csv的文件,图中标黄的一列即为不同次run数据的ftp地址。

wget命令

接下来呢,用wget命令下载SRA数据,有两种方式:

下载单次run的sra数据,可以直接用命令,默认下载到当前目录下。其中-c 50 参数是指若下载过程中断,会自动尝试50次继续下载:

代码语言:javascript
复制
wget -c 50 https://sra-downloadb.st-va.ncbi.nlm.nih.gov/sos2/sra-pub-run-4/ERR635048/ERR635048.1

若想批量下载这个样本的四个SRA数据,可以将这四个ftp地址整合到一个文件中(如文件名为list.txt)。

利用wget函数,-i 参数给出文件的名字

代码语言:javascript
复制
wget -c 50 -i list.txt

小编总结

如何获取SRA的ftp地址,以及如何批量下载SRA数据你学会了吗?get了这个技能,你就可以原地休息啦!

END

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-03-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作图丫 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档