前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >synapseclient—Synapse数据平台交互工具

synapseclient—Synapse数据平台交互工具

作者头像
生信菜鸟团
发布2024-01-19 18:21:36
1.2K0
发布2024-01-19 18:21:36
举报
文章被收录于专栏:生信菜鸟团

工欲善其事必先利其器

1synapseclient

synapseclient 是一个 Python 库,专门设计用于与 Synapse 数据平台进行交互。其具有以下功能

  1. 数据上传与下载:允许用户方便地上传和下载数据集到 Synapse 平台。这对于处理大型生物医学数据集尤其有用。
  2. 数据管理:提供了一套工具来管理在 Synapse 上存储的数据,包括创建和更新数据集、文件夹和项目。
  3. 协作支持:支持与其他研究人员共享数据和分析结果,促进协作研究。
  4. 查询功能:能够执行复杂的查询操作,以便快速查找和检索特定的数据集和分析结果。
  5. 工作流程集成:可以轻松集成到现有的数据分析工作流程中,与其他生物信息学工具和脚本协同工作。
  6. 权限和安全性:支持精细的访问控制,确保数据的安全性和合规性。

2Synapse

Synapse 是一个开源的数据共享和分析平台,主要用于协作科学研究,允许团队共享数据、跟踪分析和协作。它由 Sage Bionetworks 创建和管理,Sage 是一家位于华盛顿州西雅图的非营利性健康研究组织,成立于 2009 年,旨在支持复杂的数据分析工作流程,同时促进研究数据的共享和再利用。

数据库文档:https://help.synapse.org/docs/Getting-Started.2055471150.html

3数据下载

Synapse提供多种下载方式

  • 网页下载——单个文件下载最大大小为5G,批量下载最多同时100个文件
  • 编程方式下载——Synapse提供Python、R 的客户端下载方式;其中Synapse Python 库 可以通过synapse 命令从命令行使用
  • 如果需要下载开放的数据,首先需要注册一个账户
  • 不同账户具有不同的权限,若要访问 受控访问数据,必须是认证用户或者验证用户

用户权限

Synapse 中的大多数项目都具有与其关联的唯一标识符。此标识符称为 Synapse ID 或 synID。synID 格式是前缀“syn”,后跟 8 个数字(例如,syn12345678)。Synapse 中具有唯一 synID 的项包括:文件、文件夹、项目、表、视图、Wiki、链接和 Docker 存储库。以编程方式使用 Synapse 时,可以使用 synID 引用特定项。

4如何安装

Github

  • https://github.com/Sage-Bionetworks/synapsePythonClient

推荐使用conda来配置环境,方便快捷

代码语言:javascript
复制
conda create -n synapseclient python=3.9 
conda activate synapseclient
pip install synapseclient

##检查是否安装成功
synapse -h

安装

5如何使用

首先需要注册一个账号

注册时需要先提供一个邮箱,注册页面链接会发送到你的邮箱

填写对应的信息

注册完成,进入自己的账号界面

使用账号密码登录

代码语言:javascript
复制
## 需要账号登录
synapse login -u username  -p password

使用账号、密码登录

提示通过密码登录方式已经弃用

使用令牌登录

创建令牌

Token

代码语言:javascript
复制
## 登录
synapse login -p your-token

token登录

仅仅登录的话,也可以使用,但是每次下载都需要输入token 交互,这非常不方便,因此我们可以来配置一下.synapseConfig 文件

代码语言:javascript
复制
synapse config

## 此时会生成一个 .synapseConfig  文件。里面会记录你的token信息

下载数据简单演示

示例数据目录结构

具体下载文件

下载前首先需要找到你要下载的文件的 synID , 比如演示数据的“syn3260973”

代码语言:javascript
复制
##如果文件有多个版本,可以指定版本下载
##下载文件的第3个版本
synapse get syn3260973 -v 3 --downloadLocation ~/syna_test/

-v #指定下载版本
--downloadLocation # 指定下载保存位置

## 下载后文件大小
 88M 1月  16 17:41 run0574_lane1_read1_index27=H9-EB.fastq.gz
## 但是文件名很诡异,后续需要文件重命名

##递归下载(批量)
synapse get -r syn2390898 --downloadLocation ~/syna_test/test

下载整个目录

访问限制

如果数据有访问限制,那就需要申请获取权限

代码语言:javascript
复制
synapse get -r syn26329901  --downloadLocation ~/syna_test/BRI

提示需要申请

需要申请才能下载

更多参数用法可以参见:

  • https://python-docs.synapse.org/tutorials/command_line_client/

参考链接:

  • https://help.synapse.org/docs/Getting-Started.2055471150.html
  • https://python-docs.synapse.org/tutorials/command_line_client/
  • https://github.com/Sage-Bionetworks/synapsePythonClient
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-01-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信菜鸟团 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1synapseclient
  • 2Synapse
  • 3数据下载
  • 4如何安装
  • 5如何使用
    • 首先需要注册一个账号
      • 使用账号密码登录
        • 使用令牌登录
          • 下载数据简单演示
          领券
          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档