前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >ArrayExpress数库简介

ArrayExpress数库简介

作者头像
生信修炼手册
发布2019-12-19 10:48:15
1.6K0
发布2019-12-19 10:48:15
举报

和GEO数据库类似,ArrayExpress是属于EBI旗下的公共数据库,用于存放芯片和高通量测序的相关数据,网址如下

https://www.ebi.ac.uk/arrayexpress/

数据来源于下图所示的两个部分

第一部分是由科研工作者提交的数据,第二部分是从GEO数据库自动导入的数据,在该数据库中,数据以实验experiments为单位,每个实验对应一个唯一的编号,如下图所示

第一列的Accession代表每个实验设计对应的编号,Assays表示该实验对应的样本总数,Raw代表原始数据。当前版本数据量如下

通过该数据库,我们可以

  1. 检索数据,根据关键字,编号等查找感兴趣的数据集
  2. 下载数据,基于公共数据进行分析挖掘
  3. 提交数据,上传自己的数据到该数据库中

点击每个实验编号,可以显示详细信息,示意如下

红框标记的部分是通常会关注的3个部分,第一部分展示该实验包含的样本的详细信息,点击之后可以查看样本相关的metadata, 示意如下

第二部分用于下载数据,第三部分用于将该结果导入到其他软件,比如GenomeSpace中进行分析和查看。

除了下载和分析公共数据集,也可以上传自己的数据到该数据库。除了宏基因组/宏转录组, 转录组组装的相关结果数据,其他绝大部分数据都是可以上传到该数据库的,比如SNP分型,基因表达谱,chip_seq, atac_seq, 甲基化测序等结果都可以。

该数据库还配套了对应的API和R包,可以批量化,流程化地检索和下载数据,在没有数据的情况下,也可以基于ArrayExpress的公共数据进行深入挖掘。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-08-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档