代谢组学研究中常用的数据库(四)

LIPID MAPS Structure Database

LMSD数据库(LIPID MAPS Structure Database,http://www.lipidmaps.org/data/structure/)包含了生物相关的脂质的结构以及注释。该数据库包含了超过40000个脂质的结构,这使其成为了目前世界上最大的公共脂质数据库。LMSD数据库将所有的脂质分为八个类别,每个类别又具有自己的下一级分类。所有在LMSD数据库中的脂质化合物都被分配了一个编号。

用户可以使用“Text/Ontology-based search”功能通过输入脂质类别、常用名、系统命名、分子量、InChIKey命名或者 LIPIDMAPS 编号来进行化合物搜索。

也可以使用“Structure-based search”功能通过绘制化合物结构来进行化合物检索。LMSD中的每一个记录包含该脂质对应的分子结构,通用名和系统命名,外部数据库的链接,化合物的物理化学性质等信息。

LMSD还包含了几种脂质类化合物的化学标准品的信息(http://www.lipidmaps.org/data/standards/search.html),包括保留时间的数据、带有主要子离子归属的MS/MS质谱图,以及一些串联质谱信息采集的仪器参数设置等信息。

大多数的标准品由Avanti® PolarLipids公司提供,也有一部分由Cayman Chemical Company提供。其中包括了这些包括197种脂肪酰类化合物,21种甘油脂,242种甘油磷脂,18种鞘脂,38种甾醇脂质,9种炔醇以及4巯基脂质。但是所有的串联质谱图只能以图像形式查看,这也在一定程度上妨碍了用户对这些质谱数据的进一步解析。

LMSD所包含的质谱分析工具(http://www.lipidmaps.org/resources/tools/index.php?tab=ms),可以通过实验中获得的母离子和子离子的数据来帮助用户推测可能的脂质结构。但是使用母离子进行检索时,用户需要选择目标离子可能属于的脂质类别(如甘油磷脂类、胆固醇酯类、甘油酯类等),当然也可以将类别全选进行检索,而且每次只能使用一个母离子进行搜索

在进行子离子检索时,用户可以将实验中的MS/MS数据与预测的“高概率”子离子(如侧链或者headgroup等)进行匹配来完成检索。

其不足表现在,每一类化合物的串联质谱图都仅对一个检测模式下的数据进行预测(正离子模式或者负离子模式),并未对两个离子模式都进行预测。而且每一类脂质化合物仅提供一种加合离子(如甘油酯类化合物值提供[M+NH4+]离子)。

LipidBlast

Fiehn实验室于2013年上线了一款免费的数据库,该数据库基于计算机预测的脂质类化合物的串联质谱信息来帮助研究者对脂质类化合物进行注释。该数据库包含了212685张MS/MS质谱图,涵盖了来自于29个类别的119341个化合物。其中,超过一半的数据是从LMSD数据库导入或者使用LIPIDMAPS Tool来生成,覆盖了13个类别的脂质类化合物。

LipidBlast数据库还包含了许多没有被LMSD数据库包含的细菌和植物脂质信息。该数据库使用计算机生成了78314个正离子模式数据和134202个负离子数据,同时也包含了多种加合离子的类型,如[M + H]+、[M + Na]+、 [M + NH4]+、 [M-H]−、[M–2H](2−)、 [M + NH4 − CO]+、 [M + 2Na − H]+ 、[M]+ 、[M − H + Na]+以及 [M + Li]+ 等。

由于LipidBlast数据库主要是基于离子阱的CID模式采集的串联质谱信息进行建立,因此该数据库的不足之处在于,碎片信息模拟受到了“三分之一歧视效应”的影响,即如果一个子离子的分子量低于母离子分子量乘以28%,则该离子不能能被检测到。所以,计算机预测的串联质谱信息可能会丢失掉一些子离子的信息,例如一些glycerophospholipids类化合物中的m/z 184的碎片。

扫一扫关注我们,

更多咨询早知道!

公众号邮箱:

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180711G094N100?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券