前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >是人是鼠,你心里没有数?GPL21827之谜

是人是鼠,你心里没有数?GPL21827之谜

作者头像
生信技能树
发布2019-12-11 10:36:26
1.6K0
发布2019-12-11 10:36:26
举报
文章被收录于专栏:生信技能树

最近在对GEO数据库的全部GPL平台的芯片探针序列进行批量重新注释的时候,发现如果工具芯片自带的物种信息来自动化选择参考基因组,居然还会出现某个芯片探针比对率非常低的情况, 比如GPL21827这个平台:

代码语言:javascript
复制
60898 reads; of these:
  60898 (100.00%) were unpaired; of these:
    59099 (97.05%) aligned 0 times
    1753 (2.88%) aligned exactly 1 time
    46 (0.08%) aligned >1 times
2.95% overall alignment rate

因为在GEO数据库,它居然被记录为mouse这个物种,但是它明明是human啊!

代码语言:javascript
复制
Agilent-079487 Arraystar Human LncRNA microarray V4 (Probe Name version)
GPL21827
Public on May 07 2016
2016/5/6
2016/5/7
in situ oligonucleotide
Mus musculus
Agilent Technologies

实在是太诡异了:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL21827

可是我在GEO官网查询它:Agilent-079487 Arraystar Human LncRNA microarray V4 (Probe Name version)

物种又是human。

image-20191203111321663

这并不是唯一的比对率低的情况:

一款circRNA芯片:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL23467

代码语言:javascript
复制
170351 reads; of these:
  170351 (100.00%) were unpaired; of these:
    169391 (99.44%) aligned 0 times
    811 (0.48%) aligned exactly 1 time
    149 (0.09%) aligned >1 times
0.56% overall alignment rate

一款miRNA芯片 : https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL8180

代码语言:javascript
复制
380 reads; of these:
  380 (100.00%) were unpaired; of these:
    215 (56.58%) aligned 0 times
    138 (36.32%) aligned exactly 1 time
    27 (7.11%) aligned >1 times
43.42% overall alignment rate

当然了,circRNA芯片和miRNA芯片 没有注释的必要性了,但是lncRNA和普通的mRNA芯片我都已经搞定啦

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-12-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档