

Journal: Database: The Journal of Biological Databases and Curation
IF: 3.683
Published: 01 December 2014
Citation: 34
Link: https://academic.oup.com/database/article/doi/10.1093/database/bau118/2635556
目前公共数据库中的大多数蛋白质序列尚未经过实验验证,基于同源性的方法仍然是最常用的注释蛋白质功能的方法,但这种方法导致了错误注释的传播。
包含多个催化不同反应的酶超家族的注释错误已经被公认为公共数据库中的一个大问题,与芳香族化合物代谢途径相关的蛋白数据也受到了显著影响。
目前已有的降解相关的数据库:
Biodegrative Strain Database:
降解菌及其降解的底物,包括相应的文献引用、相关专利和附加生物或化学数据的链接。
The University of Minnesota Biocatalysis/Biodegradation Database(UM-BBD):
根据微生物的已知反应,预测有机化合物降解的可能途径
Metarouter:
关注生物降解的生物化学方面,可预测降解过程的通路或网络。然而蛋白质序列信息的缺乏限制了它在基因组数据分析和注释中的应用
FunGene:
提供生物降解关键蛋白的序列信息。但没有阐明可能的错误注释
Database of Biodegradative Oxygenases—OxDBase及web-based server PathPred:
这些数据库通常直接链接到完整基因组测序项目过程中注释的蛋白质
Bionemo:
是UM-BBD的改进版本,蛋白质和反应之间的精确关联是基于定制的数据库搜索、广泛的文献挖掘和人工筛选。Bionemo结合了代谢、遗传和调控信息,但它的web界面自2008年以来就没有更新过。
到目前为止,还没有一种单一的资源能够提供基于蛋白质序列信息的直接查询和通过系统发育基因组方法的数据挖掘。
系统发育基因组学(Phylogenomic analysis):是结合系统发生树构建和实验数据集成的方法。其可解决同源性预测功能的不足,提高准确性。
之前的研究表明,采用系统基因组方法对蛋白质进行功能分类,其假阳性结果较少。
在此基础上建立了AromaDeg,一个基于web的资源,目标是芳烃的有氧降解。其解决了基于同源性的蛋白质功能预测的不足,结合系统发育树构建和实验数据整合,获得更准确的关于好氧芳香生物降解途径的新生物数据注释。
AromaDeg是基于系统基因组方法构建的手工管理数据库(更新于2013年9月)。包括了基于关键代谢蛋白家族蛋白序列的系统发育分析和功能蛋白的系统发育分析。
共包括3605条蛋白序列,主要涵盖四类酶: Rieske非铁血红素加氧酶α亚基;邻位螯合物超家族的雌二醇双加氧酶;LigB超家族的雌二醇双加氧酶和cupin超家族的雌二醇双加氧酶。

对于Rieske非铁血红素加氧酶,酶的聚类与其成员氧化的底物有关。AromaDeg收集了4类加氧酶,分别为邻苯二甲酸酯双加氧酶、联苯双加氧酶、苯甲加酸氧酶和水杨酸加氧酶。
在收集完序列之后,利用BLASTP与GenBank 进行比对。E-value 阈值为1e−20. 得到的序列用MAFFT对齐,MEGA5 建树。
数据库地址
http://aromadeg.siona.helmholtz-hzi.de

比对时可以选择4类中特定的数据库:

Download中可以下载所有的数据库序列

本质上来说这个数据库就是普通的blast比对之后再建了个树。。。
END