首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

AI算法加持,基因编辑如虎添翼

2012年,CRISPR-Cas9基因编辑技术被开发出来,该技术被称为 "分子剪刀",允许研究人员通过在任何位置切割基因组来移除、添加或修改DNA部分。CRISPR-Cas9技术已被用于研究哪些基因在不同的条件下是关键的,如罕见的疾病和癌症,并开发修复或关闭危险突变或基因的治疗方法。

基因编辑技术的创新导致了碱基编辑的发展,它们通常被称为 "分子铅笔"。它们可以替换单个DNA碱基,是CRISPR-Cas9技术的延伸。最近的基因编辑工具创建于2019年,被称为先导编辑。这些 "分子文字处理器 "可以直接在基因组上进行高精确度的搜索和替换操作。

这些技术的最终目标是纠正人类基因的有害突变。科学家们已经发现有超过16000个小的缺失变体,即从基因组中删除了少量的DNA碱基,与各种疾病有因果关系。例如,囊性纤维化,仅三个DNA碱基的缺失导致70%的病例。2022年,碱基编辑的T细胞被成功地用于治疗一个之前的化疗和骨髓移植都失败了的病人的白血病。

目前基因编辑的挑战之一是实现基因编辑的高效率和高精确度。虽然CRISPR-Cas9系统已经使高度精确地编辑基因成为可能,但它仍然不完美,可能导致意外的脱靶效应。此外,一些类型的细胞难以编辑,而且基因编辑可能与免疫反应和引入新的突变等风险有关。研究人员正在不断努力提高基因编辑工具的准确性和效率,同时最大限度地减少与使用这些工具相关的风险。

日前,桑格研究所的研究人员开发了一种新的工具,它可以预测使用先导编辑技术将基因编辑的DNA序列成功插入细胞的基因组中的可能性。这种新的基因编辑技术是CRISPR-Cas9的进步,在治疗人类的囊性纤维化和癌症等遗传疾病方面具有巨大潜力。

这项研究于2023年2月16日发表在《自然-生物技术》杂志上,研究了数千种利用质体编辑插入基因组的不同DNA序列。这些结果随后被用来训练一种机器学习算法,该算法可以帮助研究人员开发出补救特定遗传缺陷的最佳方法。这一发展有望加速将原点编辑引入临床应用的努力。

来自桑格研究所的科学家们创造了3604个DNA序列,长度从1到69个DNA碱基不等。这些序列在不同的DNA修复背景下利用不同的先导编辑传递系统,被添加到三个不同的人类细胞系中。一周后,作者们对细胞的基因组进行测序,以确定编辑是否成功。

对每个序列插入的成功率进行了分析,以确定影响每个编辑成功的共同因素。研究人员发现,序列的长度和使用的DNA修复机制的类型是关键因素。

据来自惠康桑格研究所的该研究的主要作者Jonas Koeppel说:"众多的变量影响着基因组的成功编辑,但我们开始理解哪些因素会增加成功的可能性。虽然序列长度是一个关键因素,但插入过程并不是那么简单,因为较长的序列插入起来更具挑战性。我们还发现,一种DNA修复机制阻止了较短序列的插入,而另一种则阻止了较长序列的插入"。

为了理解获得的数据,科学家们采用了机器学习来识别影响插入成功的模式,如序列长度和使用的DNA修复类型。在对现有数据进行训练后,该算法在新数据上进行了测试,并准确预测了序列插入的成功率。

第一作者Juliane Weller说。"简单地说,DNA的几种不同组合可以编码蛋白质中的同一个氨基酸。这就是为什么要基因在蛋白质水平上实现相同的结果,却会有数百种方法可以进行编辑。通过将这些潜在的基因编辑输入机器学习算法,我们已经创建了一个模型,根据它们发挥作用的可能性对其进行排名。我们希望这将消除先导编辑中涉及的许多试验和错误,并大大加快研发进展。

该团队的下一个目标是为所有已知的人类遗传疾病创建类似的模型,以了解质料编辑是否以及如何修复它们。桑格研究所的其他研究小组及其合作者将协助进行这项工作。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20230217A009JD00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券