粳稻参考基因组ID转换

World map showing that the genus Oryza is widely distributed, Rod et al 2018

粳稻参考基因组日本晴主要常用的有两个版本,分别为The Rice Annotation Project (RAP)(https://rapdb.dna.affrc.go.jp/index.html)和Rice Genome Annotation Project (RGAP7,MSU)(http://rice.plantbiology.msu.edu/index.shtml)。分别由两个团队进行维护,因此其注释基因数量和基因登录号也不相同。

RAP格式为“Os-Chr-g-number”,MSU格式为“LOC_Os-Chr-g-number”。

日常分析数据过程中会遇到两种格式ID相互转换的问题。PlantGSEA(http://structuralbiology.cau.edu.cn/PlantGSEA/)提供了非常方便的在线ID转换工具。本文也提供一个脚本来供研究者在无法登陆PlantGSEA网站时方便地完成ID转换。

☆STEP1:下载文件

ID对应文件下载自RAP网站,请点击以下链接下载:

https://rapdb.dna.affrc.go.jp/download/archive/RAP-MSU_2018-03-29.txt.gz

如果你对Python脚本使用有一些熟悉,那么,请使用以下示例脚本完成转换,如果你有更好的方法或者对脚本有改进意见,请留言交流。

脚本示例:MSU to RAP

脚本示例:RAP to MSU

☆STEP2:配置环境

☆STEP3:转换

示例脚本及文件

下载好示例脚本及文件后,将你想要转换的ID列表(单列)粘贴至your-id-list-one-gene-per-line.txt文件中,接着使用cmd+R调出WIN命令行,轻松完成转换。

MSU to RAP 结果示例

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180831G12ZJN00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券