Aspera下载NCBI和EBI文件

Aspera下载和安装

Aspera下载: http://downloads.asperasoft.com/connect2/

wget http://d3gcli72yxqn2z.cloudfront.net/connect/bin/aspera-connect-3.5.1.92523-linux-64.tar.gz
tar zxf aspera-connect-3.5.1.92523-linux-64.tar.gz
sh aspera-connect-3.5.1.92523-linux-64.sh
echo 'PATH=$PATH:~/.aspera/connect/bin/' >> ~/.bashrc
source ~/.bashrc
ascp --help

软件一般安装在 ~/.aspera/connect/ 目录下。

Aspera使用: 使用说明:https://www.internationalgenome.org/faq/how-download-files-using-aspera

Aspera 高速下载 NCBI或 EBI 上的数据:

1.EBI 数据下载:

ascp -T -l 200M -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh \
  --host=fasp.sra.ebi.ac.uk --user=era-fasp --mode=recv \
  /vol1/fastq/ERR105/ERR105009/ERR105009_1.fastq.gz ./
#或者
ascp -T -l 200M -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh \
  era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq/ERR105/ERR105009/ERR105009_1.fastq.gz ./

2.NCBI数据下载:

ascp -T -l 200M -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh \
  --host=ftp-private.ncbi.nlm.nih.gov --user=anonftp --mode=recv \
  /sra/sra-instant/reads/ByRun/sra/ERR/ERR105/ERR105009/ERR105009.sra ./
#或者
ascp -T -l 200M -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh \
  anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/sra/ERR/ERR105/ERR105009/ERR105009.sra ./

主要参数: -v verbose mode 详细模式,显示运行记录 -T 不进行加密。若不添加此参数,可能会下载不了。 -i 免密从SRA和ENA下载的私钥,为·安装 aspera 后有在目录 ~/.aspera/connect/etc/ 下的asperaweb_id_dsa.openssh 文件。 -l 设置最大传输速度,一般200m到500m,默认似乎是10m/s的速度,比较慢 -k 断点续传,一般设置为值1 -P 用于SSH身份验证的TCP端口,一般是33001 --host=string ftp的host名,NCBI的为ftp-private.ncbi.nlm.nih.gov;EBI的为fasp.sra.ebi.ac.uk。 --user=string 用户名,NCBI的为anonftp,EBI的为era-fasp。 --mode=string 选择模式,上传为 send,下载为 recv。

欢迎关注~

参考: https://zhuanlan.zhihu.com/p/39387340 https://www.jianshu.com/p/f16ed4c79739 https://ngs-data-for-pathogen-analysis.readthedocs.io/zh_CN/latest/chapter_01/01_get_data.html https://blog.csdn.net/herokoking/article/details/76530517

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • pandas的一些小知识

    生信编程日常
  • python处理bam/sam文件利器pysam

    在python中读取、处理文件可以用pysam这个包。以下简单介绍一下这个包的使用。

    生信编程日常
  • 基因芯片分析流程

    读取array数据首先确定一下测序平台和数据系列,然后用相应的包读取基因表达芯片数据-CEL格式文件并处理成表达矩阵。 affy包(Affymetrix 平台...

    生信编程日常
  • 新闻动态 | 马化腾《人民日报》刊文:推动上“云”用“数” 建设产业互联网

    近期国家积极布局新基建、数据要素培育,以“上云用数赋智”行动等举措助力数字经济新业态新模式发展。在此背景下,腾讯公司董事会主席兼首席执行官马化腾先生于2020年...

    优图实验室
  • 填坑系列(2):除了Jetson Nano,原来我还需要准备这些....

    建议容量用64GB,如果你后面需要安装JetBot镜像,那么你至少准备128GB。

    GPUS Lady
  • org.apache.commons.pool 对象池

    创建新的对象并初始化的操作,可能会消耗很多的时间。在需要频繁创建并使用这些对象的场景中,为了提供系统性能,通常的做法是,创建一个对象池,将一定数量的对象缓存到这...

    IT云清
  • 你了解 Typescript 吗

    TypeScript 是 JavaScript 的超集,带来了诸多新特性:可选的静态类型、类型接口、在 ES6 和 ES7 被主流浏览器支持之前使用它们的新特...

    王贝珊
  • 简单设计的四个要素(译)

    我意识到我从来没有将这些写下来,虽然我在作为一个教练和导师时会常常提到这些。 更新于2013年12月11日。你读完这篇文章后,一定会想读下一篇文章。

    Joel
  • Learning Hierarchical Features from Generative Models 及代码

    Deep neural networks have been shown to be very successful at learning feature h...

    用户1908973
  • 科学瞎想系列之八十八 永磁电机(9)

    【图片部分来自网络如有侵权敬请邮箱联系。欢迎原文转发到朋友圈,未经许可的媒体平台谢绝转载,如需转载或合作请邮件联系。联系邮箱laolicsiem@126.co...

    标准答案

扫码关注云+社区

领取腾讯云代金券