REPIC(RNA EPItranscriptome Collection)数据库记录了大约1000万个peak,这些peak是使用统一的分析方法从公开可用的m6A-seq和MeRIP-seq数据中得到的。将这些数据在内置基因组浏览器中呈现,用以展示m6A甲基化位点、组蛋白修饰位点和染色质可及性区域。REPIC的网址是:https://repicmod.uchicago.edu/repic。
为了更好地探索日益复杂的m6A数据集,已经构建了几个数据库(RMBase v2.0、MET-DB v2.0、CVm6A)和Web服务器(RNAmod、Well、SRAMP)来组织和集成现有资源。
其中,RMBase v2.0整合了5种或更多类型的RNA修饰、RBP结合位点和单核苷酸多态性的位点信息,而Met-DB v2.0和CVm6A从原始m6A测序数据中公布了由它们自己的分析方法处理的m6A peak(表1)。
最近的研究发现了m6A修饰与启动子或组蛋白标记之间的联系,为潜在的调控途径及其机制提供了新的见解。通过这些途径,m6A可以影响转录调控和基因表达。然而,m6A修饰和表观基因组数据并没有很好地协调在一起,需要新的生物信息学工具来处理、分析和可视化这些数据的集成。
表1 REPIC与已发表数据库的比较总结
为了深入了解m6A修饰的细胞或组织特异性,REPIC支持按细胞系或组织类型查询m6A修饰。在搜索页面上,作者列出了所有可用的细胞系和组织类型的选项,旁边是过滤选项 (图1)。一旦提交的查询完成,将在用户友好的界面中呈现报告,其中包含每个peak的以下信息:基因组位置、识别peak的分析工具、丰富指数和基因组特征注释等。详细操作说明见https://repicmod.uchicago.edu/repic/manual.php。
图1 REPIC数据库的web界面截图