iNature
灵长类特异乃至人特异新基因起源是推动人类表型演化的重要推动力,但只有少量新基因功能已知。近年来基因编辑技术和类器官技术的发展使得系统揭示新基因在人之所以为人这一演化过程中的贡献成为可能。然而,由于基因年龄推断方法的差别以及较低的新基因注释质量(很难区分新蛋白编码基因和假基因),文献中已经发表的灵长类特异新基因(PSG)数据集相互之间差别极大。一个相对可靠的PSG数据集的缺乏阻碍了深入的功能研究。
2019年3月12日,中科院动物所张勇团队在Genome Research上在线发表了题为GenTree, an integrated resource for analyzing the evolution and function of primate-specific coding genes的文章,通过整合进化基因组和功能基因组数据开发了人类新基因数据库。GenTree可辅助用户分析基因何时起源、如何起源以及可能的功能。
基于GenTree数据的整合分析发现:1)以基因组共线性为基础的基因年龄推断方法与其它方法相比对近期起源的基因有较高的准确率;2)蛋白水平的选择压力推断和蛋白基因组方法(proteogenomics)只能注释部分灵长类特异基因的蛋白编码能力。本研究考虑了这些方法各自的特点之后鉴定了846个PSG(图2)。其中,254个基因有不同程度的蛋白支持证,该集合也包含了41个错误注释的假基因(如MYH16)。
GenTree网页界面示例
基于GenTree中所整合的转录组数据,本研究通过共表达分析推测了846个PSG的功能。与此前的认识相符,PSG经常呈现睾丸特异或睾丸偏好的表达;但PSG也呈现骨髓或胎盘偏好的表达谱。有意思的是,虽然PSG在成年脑中的表达量较低,但在孕中期胎脑表达上调(图3)。富集于各共转录网络并占据网络较核心位置的PSG可能推动了精子发生、免疫反应、母胎互作以及胎脑发育等快速演化的生命过程。
灵长类特异基因列表
总体来看,该工作提供了一个专门的人类新基因数据库,产生了相对高质量的PSG列表并推测了这些基因的功能。结果中所展示的年龄推断方法、基因注释方法的特点以及新基因器官特异的功能偏好性对研究其它物种种系特异基因的工作具普遍参考意义。
—END—
内容为【iNature】公众号原创,欢迎转载
领取专属 10元无门槛券
私享最新 技术干货