首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >RNA-seq(2)-2:下载数据

RNA-seq(2)-2:下载数据

作者头像
Y大宽
修改2025-08-12 14:45:08
修改2025-08-12 14:45:08
96000
代码可运行
举报
文章被收录于专栏:Y大宽Y大宽
运行总次数:0
代码可运行

这节按生信技能树的要求进行数据下载,同时下载一组肝癌数据。 文章:AKAP95 regulates splicing through scaffolding RNAs and RNA processing factors. Nat Commun 2016 Nov 8;7:13347. PMID: 27824034 很容易在文章里面找到数据地址GSE81916 这样就可以下载sra文件作业,看文章里的methods部分,把它用到的软件和参数摘抄下来,然后理解GEO/SRA数据库的数据存放形式,把规律和笔记发在论坛上面!


1.0 论坛作业数据下载

首先,按照这个方法可以去查找文章和数据。共下载7个文件,我仿写了个代码,如下: 运行起来速度还是很好,平均5M/S.

代码语言:javascript
代码运行次数:0
运行
复制
cd /mnt/f/rna_seq/data
for ((i=56;i<=62;i++));do ascp -QT -v -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -T -l200m anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/sra/SRR/SRR358/SRR35899${i}/SRR35899${i}.sra .;done
备注:下载总共大概6h。

1.00下载自己的数据

首先在https://www.ncbi.nlm.nih.gov/sra,输入liver cancer,下载个较小的肝癌数据。选定https://www.ncbi.nlm.nih.gov/sra?term=SRP007560 (这个过程我是反着来的,现在SRA找到合适的数据,然后再下载文章) 具体信息见这里这里

需要下载的四个数据为SRR316212 -215 同样,代码为

代码语言:javascript
代码运行次数:0
运行
复制
for ((i=2;i<=5;i++));do ascp -QT -v -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -T -l200m anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/sra/SRR/SRR316/SRR31621${i}/SRR31621${i}.sra .;done
-QT表示断点续传
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018.07.29 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.0 论坛作业数据下载
  • 1.00下载自己的数据
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档