专栏首页数据库dbGaP加密数据权限申请和数据解密

dbGaP加密数据权限申请和数据解密

我们在NCBI、TCGA、GEO等数据库下载数据时,经常遇到controlled access(限制下载)的数据,不知道怎么弄,有时选择其他可以下载的数据代替,或者直接放弃了。其实这些数据库都是需要通过dbGaP申请下载权限的。

这里就以NCBI为例给大家介绍一下dbGaP数据权限申请过程,以及数据下载解密时要注意的地方。

Step1:获取账号

dbgap账号需要NCI/NIH认证资格,一般是实验室的PI、且申请过NIH或是NCI的资助,才可能有dbgap账号。所以我们要咨询一下实验室的PI有没有账号,有的话基本成功一半了。

Step2:创建Project

Step3:填写项目内容

项目申请的页面如下:

A. 首先要选择你要申请的dataset,这里可以搜索dataset的编号,也可以按照类型筛选,勾选dataset前面的多选框就行(可多选)。选择好之后拉到最下面,点击”Add Selected and Continue”。

B. 下面就要填写你的项目内容,也就是你申请这个数据要用来做什么研究的具体介绍。包括:项目名称、项目具体介绍、以及非专业的介绍。此外还需要选择SO信息、 Collaborators、IT Director等信息,这些信息PI都有,可以让你们实验室的PI填写。有的数据要按要求准备其他(比如:IRB approval)文件并上传。

C. 确认信息、提交

填写完基本信息之后,在Confirm Datasets那一栏里确认一下信息,一步步确认点下来,提交就可以了。然后就是等待。。。。。几个星期之后可以在My Request里面查看审核状态。

Step4. 下载数据和Key

点击Downloads,可看到审核通过的可以下载的datasets列表,点击右侧Actions栏里面的Download可以下载数据(需要安装aspera),此处下载的数据是加密的,文件后缀是".ncbi_enc"。点击"get dbGaP repository key"下载解密要用的key,文件以“.ngc”结尾。

Step5. 文件解密

解密使用的软件是SRA-Toolkit,建议在linux端运行。

导入key文件:

vdb-config --import xxxx.ngc

(xxxx.ngc为key文件)

此时会自动创建"/home/ncbi/dbGaP-xxxx"文件夹及一些子目录,之后的解密命令要进入该文件夹操作

进入ncbi路径:

cd /home/ncbi/dbGaP-xxxx

运行解密命令:

vdb-decrypt xx.ncbi_enc

(xx.ncbi_enc为下载的需要解密的文件)

注意,运行vdb-decrypt时一定要切换到ncbi路径里,否则会报错!

大功告成!就可以看到文件加密后缀不见了,变成我们熟悉的文件格式。

以上就是dbGaP数据申请和下载解密的方法,希望大家都能顺利申请到权限,利用好公共数据库。

本文来自企鹅号 - 生信草堂媒体

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Python爬虫实战:爬取全站小说排行榜

    喜欢看小说的骚年们都知道,总是有一些小说让人耳目一新,不管是仙侠还是玄幻,前面更了几十章就成功圈了一大波粉丝,成功攀上飙升榜,热门榜等各种榜,扔几个栗子出来: ...

    企鹅号小编
  • Python之路-day6

    所谓高阶函数,简单点说就是将一个函数作为另一个函数的传入参数,这样我们就称这个组合函数为高阶函数。 举个例子: map()函数能接收两个参数,一个为函数,一个为...

    企鹅号小编
  • 筑梦2025 工业大数据产业应用联盟成立

    从“数据即资产”到数据是当代的石油,数据的价值有多大,谁都没办法测量出具体数据,但是越来越多依托大数据而形成的新商业模式出现,利用大数据辅助决策逐渐成为一种常态...

    企鹅号小编
  • 在以太坊私有链上部署智能合约

    上节简单介绍了基于以太坊搭建私有链以及挖矿和交易,在部署智能合约之前请确保私有链上的账户有余额,因为部署智能合约需要消耗 Gas ,而 Gas 需要 ether...

    字节流动
  • HBase入门与基本使用

    版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 ...

    用户1212940
  • 自动化工程师必备:如何选择执行机构气动和电动?

    1.执行机构选择的主要考虑因素 ①可靠性;②经济性;③动作平稳、足够的输出力矩;④结构简单、维护方便。 2.电动执行机构与气动执行机构的选择比较 (1)气动执行...

    机器人网
  • IBM用机器学习探寻外星文明讯号 你也可以参与其中

    大数据文摘
  • 用 Go 构建一个区块链 -- Part 4: 交易(1)

    翻译的系列文章我已经放到了 GitHub 上:blockchain-tutorial,后续如有更新都会在 GitHub 上,可能就不在这里同步了。如果想直接运行...

    用户1558438
  • 【陆勤阅读】PyCon 2014:机器学习应用占据Python的半壁江山

    今年的PyCon于4月9日在加拿大蒙特利尔召开,凭借快速的原型实现能力, Python在学术界得到了广泛应用。最近其官方网站发布了大会教程部分的视频和幻灯片,其...

    陆勤_数据人网
  • 【重温经典】吴恩达机器学习课程学习笔记十:正则化

    WZEARW

扫码关注云+社区

领取腾讯云代金券