IMP: bridging the gap for medicinal plant genomics
药用植物因其潜在的抗肿瘤、抗炎和抗氧化特性,在民族医学和传统医学中引起了极大的关注。基因组测序和合成生物学的最新进展重新激发了人们对这些天然产物的兴趣。尽管有很多药用植物的基因组和转录组测序数据,但缺乏可公开访问的基因注释和表格格式的基因表达数据,这不利于它们的有效利用。为了解决这一紧迫问题,我们开发了IMP (Integrated Medicinal Plantomics)整合药用植物组学平台(https://www.bic.ac.cn/IMP)。IMP收录了84
个高质量的基因组(预期收录所有植物的基因组),整理了848,565,672
个基因,以及2,158
个转录组测序样本,涵盖了多个器官、组织、发育阶段和胁迫刺激。通过集成的10
个分析模块,用户可以简单地在IMP中探索基因的注释、序列、功能、分布和表达。IMP的开发和使用将会从基础数据层面促进药用植物分子代谢途径的解析,进而在推动合成生物学的发展、促进药物发现和药物生产的天然来源的探索方面发挥重要作用。
具体见 NAR | 中医科学院陈同等开发整合药用植物组学平台 IMP 具体见 NAR | 中医科学院陈同等开发整合药用植物组学平台 IMP
数据平台访问地址https://www.bic.ac.cn/IMP/。首页采用平面组合布局,分为导航、网站描述、统计信息和功能展示 4 个部分。
药葫芦+DNA
双螺旋体现药用植物分子信息,辅以祥云标识,展示中国特色;全局检索
,用户输入基因名字、通路信息或任意基因功能相关单词即可搜索目标基因,开启网站的探索之旅;在首页的全局搜索框中输入基因的名字、基因的功能描述或基因的 GO 注释/KEGG通路注释的信息,即输入任何文字都可以去匹配出关注的基因(当然也有一些文字什么都匹配不出来)。比如默认选中的物种是穿心莲
,默认输入的文字是cytochrome p450
,我们需要做的就是点击Submit
提交一下,新标签页会出现搜索结果。
如果碰到页面不出来的情况下,请看下浏览器最上部菜单栏下面是否有窗口被拦截的提示。
搜索结果页面的标识条,会用红字标记搜索的文字信息, 蓝字标记选择的物种信息。下面的表格列出所有的搜索结果,分页展示:
独特的
Send to
快捷操作 很多物种的基因名字都是 ID 类似的编号,通常记不住。IMP 可以通过文字或序列的方式搜索出一系列相关基因,选择后,点击Send to
就可以把这些目标基因集发送到对应的功能模块,实现免输入 Gene ID的快速操作。比如查看搜索出的 CYP450 的整体表达信息、基因组的分布信息、批量序列提取、引物设计和多序列比对等。
页面分为 3 个部分:
padding
调整图的左、下、右的空间,以免发生文字溢出。SVG
格式,用于文章组图。可以自己按页面选择物种、数据集、样品(非必选的选项如果不选,默认是全选)、输入基因,也可以从搜索结果中直接带过来基因列表。
模糊搜索:支持根据基因的功能描述关键词进行模糊搜索,获取基因名,用于研究一类基因的表达图谱。
提交后获得基因表达图谱展示。
选择物种、Assay type、匹配模式,输入基因名(可以通过Send to
功能从其它页面发送过来),提交后获得一个相关性网络图和对应的结果数据。
用户选择物种,输入基因名字,即可进行GO/KEGG富集分析。阅读推文https://mp.weixin.qq.com/s/BCB16M4yI5Qa1tKyZy7WMg或查看视频https://www.bilibili.com/video/BV1rD4y1272a?p=4了解 GO/KEGG 富集分析的基本原理。
点击后,可调整富集分析结果的配色方案、选择富集的条目进行展示。也可以下载表格文件,到高颜值免费在线绘图平台 ImageGP/BIC https://www.bic.ac.cn/BIC进行自由绘制。
GSEA 富集分析的输入会麻烦一些,目前只支持包含一列基因和一列排序值的 2 列矩阵格式;排序值可以是常见的log2(fold change)
,p-value
或也可以是其他定量值。
阅读推文https://mp.weixin.qq.com/s/WiYUUALSmb9v5gYVxmjwjA或查看视频https://www.bilibili.com/video/BV1rD4y1272a?p=5了解 GSEA富集分析的输入数据、原理和结果解读。
默认绘制最富集的 2 条通路在一张图上,可以自己选择绘制哪些通路,也可以将通路绘制在多张图上。