首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

关于临床遗传检测数据共享的思考

变异解读的准确性和可重现性是遗传检测融入临床诊断的限速环节之一。ACMG/AMP虽然提供了变异解读标准,但仍然为各临床检测实验室主任预留对于变异证据、阈值进行适当专业判定的自由度,这可能是造成实验室间分类差异的重要原因之一。实现临床检测数据可重现性的第一步是进行可重复性测试,然而仅有一人提交的数据和分类,缺少相同患者中相同变异位点的独立测试作为比较,显然是无法完成的。因此这就需要临床实验室间的数据共享。美国相关法律法规也有明确规定,在完全去除身份信息的情况下可以公开披露患者的临床遗传数据,美国医学协会(AMA)和国家遗传学家协会(NSGC)都建议实验室进行数据共享。目前,数据共享的推动取得了相当的成效但同时也面临巨大的挑战。

随着基因检测数量日益增加,2016年即已进行超过一百万个临床基因检测,如果加上传染性疾病和肿瘤体细胞测试,检测数量更是相当庞大。除对ACMG标准理解差异外,基因本身的特点与性质也会影响一致性判定,例如临床检测最多、研究最深入的BRCA1/2基因,其本身编码序列较长,因此包含大量非热点性变异,Myriad报告显示每周都会发现超过50个新的变异,这种情况同样在研究者的实验室中观察到(下图)。此外,意义不明确变异(VUS)对不一致性影响尤其显著。大多数VUS是缺乏足够的证据判定为良性变异,ClinVar过去两年发布的数据显示BRCA1/2中约95%的VUS变异最终降级为良性或可能良性变异,Myriad数据也证实这一点。即使如此,如果4%的患者判定为VUS,其中包括5%的致病性变异,也有将近1/500携带BRCA1/2致病性变异的患者由于缺乏足够证据而被误判,进而影响临床管理。事实上,目前多基因检测逐渐替代单基因测试,通常包含25-29个基因的panel检测中VUS率能达到40%,因此对于临床决策的影响还是非常显著。

公共数据库在识别分歧和不确定性方面以及质控监测方面都起到关键作用,为实验室间协作交互提供平台,供全球不同单位对不同变异类型进行详细独立的同行评审并在出版过程中提供持续的质量评估。毫无疑问仅依靠单独一家实验室是不可能实现的,2013年美国国家卫生研究员NIH建立ClinVar公共数据平台,旨在为从业者提供免费获取变异解读临床证据的公共平台。目前得到全球数百个实验室和诊所的支持和使用,截止到2016年8月已收录来自560个提交者的超过18600个数据,其中大部分来自临床检测实验室。提交数量位于前8位的包括三个商业实验室(GeneDx、Invitae和Ambry),三个大型学术实验室(哈佛大学分子医学实验室、埃默里遗传学实验室和芝加哥大学实验室)及两个致力于文献信息汇总机构(OMIM和GeneReviews),这八个机构提交的数据占ClinVar总提交量的50%以上。

使用ClinVar数据包分析现状

2016年5月,研究者从ClinVar下载了变异分类数据包进行数据分析,几条原则分别为:

-当一个基因可以被多个疾病测试时,使用最常见的一种疾病表型;

-数据包使用于遗传检测的实验室,而非体细胞检测的变异分类;

-文献数据,专家研究数据被排除在外,例如:OMIM, ENIGMA,InSiGHT,因为这些数据并不能反映提供给临床医生的实际检测报告;

-变异分类至少由两个提交者声明;

研究者最后使用了数据包中409个基因的9875个变异(下表),这些分类中的许多都是在上述2015年的ACMG准则之前所判定,而在一个重要的证据之前所提供的证据分类确实应该与那些通过重要证据证明之后的证据不同,所以在公开的数据包中,分类的日期是很重要的。

总体而言,大部分或全部提交者的变异类型主要为良性的(B或LB);致病性变异(P或LP)占数据包的17.9%;26.9%的变异为VUS;10.7%的分类没有达成共识;变异分类在临床不同疾病的分布如下图所示:

由于我们对数据包的使用仅限于两个或更多提交者的变异,所以它自然会偏离最罕见的变异;然而这个数据包主要是由罕见的变异组成(下图),62%的变异在群体等位基因频率中小于0.001,36%的变异的频率小于0.0001,另外有22.8%的ClinVar变异不在ExAC中,这可能是因为他们是非常罕见的,或者因为它们是ExAC覆盖范围之外的;即使最常见的临床检测基因BRCA1/2,也平均每个变异有2.9个分类,ClinVar总体上包含了罕见变异的大部分,特别是当我们排除由一个提交者所提交的变异之后。

截止2016年8月,ClinVar包含超过9000个BRCA1 / 2的变异,其中许多为未分类或者视为VUS,这些变异中的大多数仅由单个提交者报告,然而这些数据仍然仅代表BRCA1 / 2中人类已知变异的一小部分,其它大部分未知变异没有提交Clinvar或不适用于ClinVar;为了更全面的了解BRCA1/2变异,BRCA交换项目在全球基因组和健康联盟的倡导下开展,由莱顿公开变异数据库(LOVD)、人群数据库和其他数据资源协同ClinVar共同组建一个BRCA1/2的特异性公开数据库。在成立初期,BRCA Exchange描述了超过13000个变异,其中很大一部分数据仅来自一个开源的数据库(下图)。

这进一步证明BRCA Exchange开展数据整合的意义。这种合作在改进变异分类方面的价值已被多个组织证明,例如针对其他特意性疾病的ENIGMA和InSiGHT等。令人兴奋的是,BRCA Exchange不仅数据是开放的,其数据库代码也是开源的,这有助于未来利用这些代码进一步提高此类研究的可重复性。

由于知情同意、医疗服务提供者的商业利益及缺乏完善的社会机制等问题,数据共享的推进存在巨大的挑战。首先一些商业实验室和学术研究实验室拒绝参与数据共享,最典型的是世界上最大的BRCA1/2检测实验室Myriad Genetics,已累积20年超过100万例家系数据,但是Myriad将其累积的庞大遗传数据库作为专有资产拒绝公开,并在随后的服务条款上禁止合作的临床医生向ClinVar数据共享。另一方面,数据分割现象严重,部分数据库的使用需要支付费用,变异分类术语没有完全实现标准化,都为整合数据带来了困扰和挑战。此外,已提交数据的准确性和标准性需要谨慎对待,在分析ClinVar数据过程中发现了一些过时和错误的提交结果。

数据共享本质上能推动临床分子诊断行业、医学遗传学的进步,目前取得了一定的成功但同时也面临巨大的挑战。研究者鼓励所有实验室和诊所为这些重要资源做出贡献。

参考文献:

[1] Yang S et al.Data sharing andreproducible clinical genetic testing:sussesses and challenges.Pac SympBiocomput.2017;22:166-176.

/End.

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20171225B0BEBU00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券