首页
学习
活动
专区
工具
TVP
发布

人类究竟有多少个基因?研究结论再度更新

人类基因组的测序工作已经完成十五年了,不过人类到底有多少个基因,目前还存在争议。近日,西班牙国家癌症研究中心领导的一项新研究表明,多达20%的编码基因也许是非编码的,因为它们带有典型的非编码或假基因特征。

这项成果发表在《Nucleic Acids Research》杂志上,将对生物医学研究产生重要影响,因为编码基因的数量及其鉴定对多种疾病的研究至关重要,包括癌症、心血管疾病等。Sanger研究所、麻省理工学院等机构的研究人员也参与了本研究。

自从人类基因组测序完成后,全世界的专家一直在绘制人类蛋白质组的图谱,并确定产生蛋白质的基因。考虑到人类基因组的复杂程度,以及我们大概有20,000个不同的编码基因,这项任务相当繁重。

研究人员分析了各个数据库中被归到蛋白质编码一类的基因。他们仔细比较了GENCODE/Ensembl、RefSeq和UniProtKB参考蛋白质组,发现了22,210个编码基因,但其中只有19,446个基因存在于三个数据库中。

在分析那些仅存在于一个或两个数据库的2,764个基因时,他们惊讶地发现实验证据和人工注释表明,几乎所有这些基因都是非编码基因或假基因。事实上,这些基因及另外1,470个编码基因,不像典型的蛋白质编码基因那样进化。他们的结论是,这4,234个基因中的大多数可能不编码蛋白质。

据科学家称,这项工作已经取得了成效。“我们已详细分析了许多基因,其中300个基因被重新归到非编码基因,”西班牙国家癌症研究中心的Michael Tress谈道。这些结果已经被GENCODE国际联盟纳入人类基因组的新注释。

虽然最新的数据表明编码蛋白质的人类基因数量超过20,000个,但Sanger研究所的Federico Abascal认为:“我们的证据表明人类可能只含有19,000个编码基因,不过我们还不知道它们是哪些。”他也是这篇论文的第一作者。

关于人类到底有多少个基因,目前还存在很大的不确定性,因为数量可能在20,000的基础上增加或减少2,000。尽管这是一项艰巨的任务,但人类参考蛋白质组对生物医学研究具有重要意义。

原文标题

Loose ends: almost one in five human genes still have unresolved coding status

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180905B1JBFV00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券