赖氨酸丙二酰化位点预测

大家好。本周分享的是发表在Journal of Computational Chemistry上的Predicting lysine-malonylation sites ofproteins using sequence and predicted structural features。作者是Griffith University的Ghazaleh Taherzadeh等人,其中Zhou Yaoqi课题组的主要研究方向为蛋白质结构和性质相关的预测。

赖氨酸的丙二酰化是最近新发现的一种翻译后修饰,在正电的Lys侧链上通过化学修饰加上一个负电的丙二酰基团。这种电性上的变化使得这种酰化修饰被认为与代谢调节,功能和结构的动态变化有很大的关联。还有研究表明,丙二酰化的产物是哺乳动物细胞、小鼠肝脏和Saccharopolyspora糖多孢菌中的关键信号分子。此外,丙二酰化还与肌肉收缩、心肌缺血和下丘脑对食欲的调控有关。

通过蛋白质组的方法,实验上已经得到了一些存在丙二酰化修饰的位点。然而这些实验上的方法存在着时间和仪器上的成本限制,并且无法对于有些物种,实验的难度还比较大。因此,开发一种能够准确的鉴定出丙二酰化位点的计算方法是有必要的。

已经报道的预测蛋白质上的丙二酰化位点的方法主要有Mal-Lys,MaloPred等,前者主要基于单条氨基酸序列上的特征和氨基酸的生化性质,后者在此基础上还加入了来自多序列的进化上的信息,还有一些方法加入已有的功能注释作为特征,采用伪氨基酸组成来训练SVM模型等。然而目前为止,这些方法所选择的特征中都忽略了基于结构而产生的修饰后位点的性质变化。分析晶体结构后可以发现,发生丙二酰化修饰的赖氨酸位点大多分布在蛋白表面,有较强的柔性并且进化上保守的区域。作者希望能将这一结构上的特征加入支持向量机模型中,并认为这一特征可以有效提高预测的准确度。

作者从已发表的实验上鉴定到的丙二酰修饰位点和PLMD 3.0修饰位点数据库中已有的丙二酰修饰位点中建立研究使用的数据库,共得到了来自M. musculus, H. sapiens 和S. erythraea三个物种的3606个有修饰的蛋白。对得到的蛋白做blast聚类,去掉相似程度较高的蛋白,保留同一组中拥有最多修饰位点数目的蛋白,最终他们得到分别来自三个物种的1282+957 +112 个蛋白质。他们进一步将数据量最大的鼠的修饰和无修饰位点中的90%作为训练集,其中十分之一作为交叉验证集,10%为独立测试集。人的数据集采取同样的操作,而菌的只取作测试集。

文章中的输入是以修饰的lys为中心的窗口截断,分别使用线性和RBF两种核函数,优化后比较发现RBF的效果更好。特征选择上,分别关注了基于序列的特征,包括氨基酸序列、进化信息、生化性质,和基于结构的特征,包括相对可及表面积,二级结构,半球暴露值(Half-sphere exposure)和固有无序区。在逐一增减特征观察模型预测效果之后,作者最终认为进化信息、氨基酸生化性质和半球暴露值对于预测模型的准确性非常重要。

本文作者:CY

文章链接:https://onlinelibrary.wiley.com/doi/abs/10.1002/jcc.25353

文章引用:DOI:10.1002/jcc.25353URL

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180831B0K46P00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券