PubCaseFinder:基于病例报道的表型驱动型罕见病鉴别诊断系统

PubCaseFinder: 基于病例报道的表型驱动型罕见病鉴别诊断系统

Am J Hum Genet. 2018 Sep 6;103(3):389-399.

背景

NGS 已越来越广泛地应用于罕见病遗传原因的诊断,在数据分析之后,患者表型与相关疾病的表型的比较和匹配依然为诊断的重要环节,然而人工操作这个过程耗时、耗力。依据患者表型与疾病表型重叠度排序的表型驱动型鉴别诊断系统可以提高分析的效率和准确率,并且开始逐渐被使用,比如基于语义相似性的Phenomizer,Phenolyzer和基于面部图像相似性比较的FACE2GENE。 这类系统的表现依赖于其参考的疾病-表型相关性数据库 (databases of disease-phenotype associations, DPAs) 的数量和质量。目前两大此类数据库分别为基于 ORDO (Orphanet Rare Disease Ontology) 的Orphanet的 和 基于 OMIM 的HPO(Human Phenotype Ontology), 但是两个数据库都不完整,比如 Orphanet 中有 60.5% 的疾病没有表型,主要有两个原因,一是数据库的添加依赖于专家对文献的校正,耗时,耗力,二是;很多罕见病的表型谱还有待研究或者有待拓展。

主要内容

为了解决上述问题,本研究从 Pubmed 中提取了 1,083,283 篇病例报道 (case report) 的文献,使用文本挖掘的方法提取语句中疾病与表型的相关性关系,将 Orphanet 的 DPAs 拓展了 125.6%,并基于此建立了罕见病鉴别诊断系统PubCaseFinder

PubCaseFinder整合了来自病例报道的 70,011 条 DPAs 和 来自 Orphanet 的 51,590 条 DPAs,为 Orphanet 已有表型的 1,483 个罕见病增加了 35,295 条新的 DPAs,并且为 Orphanet 1,589 个未关联表型的罕见病增加了 29,499 条 DPAs。 使用PubCaseFinder不仅可以通过患者表型检索到相关疾病及表型,还可以检索到已报道的病例及表型。此外,PubCaseFinder还开发了与数据分享和匹配平台IRUD (Initiative on Rare and Undiagnosed Diseases) Exchange 和 PhenomeCentral连接的 API。

为了测试PubCaseFinder的效果,研究使用了来自 PhenomeCentral 的 243 例已有表型和诊断结论的病例分别测试了PubCaseFinder上只来自 Orphanet 的 DPAs、只来自病例报道的 DPAs 和同时包含二者的 DPAs,并与 Phenomizer 和 Orphamizer 系统比较,结论是来自病例的 DPAs 可以提升鉴别诊断的表现。

部分结果展示

来自 Orphanet 和病例报道的 ORDO 词条的重叠情况

PubCaseFinder 三种设置的查全率 (Recall Rate)比较

PubCaseFinder 的三种设置,以及Phenomizer、Orphamizer 的比较

讨论和点评

PubCaseFinder通过自动对病例报道文献进行文本挖掘提取罕见病疾病与表型的关系是对目前表型库不全 Orphanet 和 HPO 是一个重要的补充。此外,平台可以通过患者表型检索到病例及文献的功能也为研究者和临床医生提供了便利。但是使用时也需要注意,通过自动文本挖掘提取的相关性,存在一定错误率,实际使用中需要对结果进行核实。此外,虽然平台允许使用者设置要匹配表型的权重,但是数据库中疾病与表型的关系并未设置表型的权重,因此也会影响匹配结果的准确性,不过文章也提出了未来会在这方面改进。除此之外,小编认为此研究的局限还包括平台只提取了表型与疾病的相关性,而且未提取表型与基因的相关性,因此假如文献中报道的新的基因与疾病及表型的相关性未被收录到 Orphanet 数据库,那么就不能在本平台检索到。而基因检测的目的是为疾病找到遗传原因,存在合理的基因变异和患者的表型与已有报道、总结的相关表型匹配同样重要,即遗传检测的本质是确定基因变异与表型的相关性。随着 WES 和 WGS 在罕见病诊断中的广泛应用,新的基因与表型的相关性或非典型的基因与表型的相关性越来越多地被报道,但是数据库的更新常常不及时,而本平台在这方面的帮助甚微。

PubCaseFinder的网址为 https://pubcasefinder.dbcls.jp/,大家可以试试。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180914G0HMZJ00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券