事由起因
昨天,有个童鞋咨询如何使用蛋白ID进行功能富集分析,功能富集分析主要是KEGG和GO。
思路
蛋白ID转UniProt数据库ID
UniProt数据库ID转KEGG和GO号
使用KEGG和GO号进行富集分析
教程(实操开始)
蛋白ID数据类型
蛋白ID的数据是的使用进行隔分的,如果要整理成一列数据,我最开始想到的就是使用进行处理。
「注:个人还是建议使用fa序列进行mapping,但是只要获得正确的结果,也无所谓。」
1. 蛋白ID转UniProt数据库ID
使用UniProt数据库的工具UniProtKB ID Mapping(https://www.uniprot.org/uploadlists/)
「1. 直接将数据-到过来即可,无需操作。」「2. 选择 To ,如下图所示。」
「3. 选择好后直接点解即可。」等待一段时间,即可完成
4. 数据格式选择其中一种即可。
获得结果
目前,已经获得UniProt数据库ID。那么,我们可以直接试用其进行转换即可,方法有两种,一种是直接在KEGG数据库中进行转换,一种是使用云平台进行转换。
KEGG数据库中机芯富集https://www.genome.jp/kegg/mapper/color.html,自己做了没成功。2.使用云平台进行转换(我们的童鞋使用基迪奥云平台进行转换,获得如下结果)
「依旧是你喜欢的样子,GO号和KEGG号都有,可以直接使用。」
方式二:使用R语言进行转换
我们在这里尝试很多方式,依旧是没有成功!需要同学们的帮助,如果你有好的建议或方式,欢迎进行交流,这个问题一直留个大家讨论!!!!
代码一
安装R包
加载数据
这里报错,找不到"idmapping"
报错后后面的依旧是进行不了,找了很多教程依旧是没找到。
代码二
这里依旧是同样的问题,那么大家看一下代码吧。我个人觉得,这个代码的可靠性更高一些。这里使用包。
加载R包
加载数据
转换
代码三
加载R包
加载数据-(同上)
转换
「没有结果!!!!」
「由于没有结果,后面富集分析也就是不能继续了!!」
「如果你想折腾,可以继续折腾!!」
「如果,你不想折腾,也开始直接使用第一种方法即可!」
「往期文章:」
「1. 最全WGCNA教程(替换数据即可出全部结果与图形)」
「2. 精美图形绘制教程」
小杜的生信筆記 ,主要发表或收录生物信息学的教程,以及基于R的分析和可视化(包括数据分析,图形绘制等);分享感兴趣的文献和学习资料!!
领取专属 10元无门槛券
私享最新 技术干货