欧洲祖先的大多数人都可以从亲戚的DNA中识别出来
全世界都了解到,警方通过使用家谱网站将犯罪现场的DNA与其远房亲属的DNA进行匹配,从而追踪了所谓的金州杀手。下一次逮捕是由同样的技术造成的。
计算生物学家雅尼夫埃利克正在努力了解这种警察搜查的范围。他们是幸运的休息吗?或者几乎每个美国人都可以通过第三个堂兄的DNA找到? “就像每次,这都是一个新案例,”他说。根据他的统计,通过遗传谱系发现的凶手,强奸犯或身份不明的人数达到了19人。
根据他的分析,这些案例并不例外,金州杀手调查人员在一个名为GED比赛的数据库中通过第三和第四表兄的比赛发现他们的嫌疑人,其中包括来自约100万人的信息。在这个规模的数据库中,埃利克和他的合着者表示,近60%的人有一个亲戚,他们是第三个表亲或近亲。
随着DNA测试的日益普及,这些数据库变得越来越大。不难想象通过亲戚的DNA可以识别几乎每个美国人。
对于那些正在进行DNA测试以寻找家庭的人来说,这是一个福音。多年前,警方意识到遗传谱系中家谱和DNA的结合,可用于识别犯罪分子和身份不明的受害者,人们正在使用DNA数据库追踪亲生父母,精子捐献者和失散多年的家庭。“这对我们来说并不意外。这些都不是我们的意外。我们多年来一直在使用它,“系谱学家肯尼特说。金州杀手嫌疑人的被捕只是唤醒了其他所有人的遗传谱系。
GED比赛是金州杀手案件中使用的数据库调查员,后来其他人也不提供DNA测试。但它允许用户从遗传测试公司上传原始数据文件,为了上传犯罪现场DNA,调查人员必须制作他们自己的DNA数据文件,模仿可能来自基因测试公司的DNA数据文件。然后GED比赛提供了一系列工具来对DNA匹配进行排序。系谱学家可以使用人口普查记录,报纸工告和其他公共记录将这些匹配与家谱联系起来。匹配越接近,它们就越快地在家谱的右侧分支上归零。
肯尼特表示,“第二场堂兄的比赛很容易,但是第四场比赛可能需要”成千上万小时的工作。“通过单一的第三场比赛来识别某人是在中间的某个地方:这不是微不足道的,但它也是很有可能。
为了找到系谱学家和执法部门找到基因匹配的准确程度,换句话说,只有几百万人的数据库足以追踪几乎所有美国人。该统计数据强调了消费者基因检测的后果:每当DNA检测者揭示其结果时,他不仅放弃了自己的隐私,而且放弃了数百名亲属的隐私。
领取专属 10元无门槛券
私享最新 技术干货