GEO是我们做数据挖掘的一个重要的公共数据来源。前面小编就给大家简单介绍过
我们经常从GEO数据库中做miRNA数据挖掘的时候,会遇到一个很头疼的问题。就是miRNA芯片数据比较老,当时的对miRNA注释可能还没有分-3p和-5p。对这个概念还不太熟悉的小伙伴可以先去下面的视频。
如果我们要使用这套数据,做差异表达分析,然后再去预测miRNA的靶基因的时候,问题就来了。现在绝大多数的miRNA靶基因预测软件使用的都是最新版本的miRbase数据库中miRNA的名字,绝大多数的miRNA名字都会带-3p或者-5p。今天小编就来给大家安利一个网站,可以一键解决上面提到的问题。
假设我们从GEO下载了一套miRNA的芯片数据,芯片平台是GPL6955。
我们可以看到这个芯片平台2008年就有了,里面的miRNA都长这样的,大部分都没有-3p和-5p,并且还有些带*号。
我们要用到的工具叫miEAA(https://ccb-compute2.cs.uni-saarland.de/mieaa2/)。我们需要使用的是miRbase converter这个工具。
把你需要转换的miRNA的名字贴到下面的对话框中,选择相应的miRbase版本号,点击submit,就大功告成了。
得到的结果是这样的,是不是so easy。
参考资料: