“基因编辑婴儿”惹争议,你或许不知道机器学习在脱靶效应中的作用?

作者|琥珀

出品| AI科技大本营

又一次,计算机科学家和生物学者站在一起,对抗人类向内探索的挑战——用机器学习预测基因编辑 CRISPR 中的脱靶效应。

今年年初,发表在《自然》生物工程杂志上的一篇论文描述了 Elevation 这项工具。该工具由微软研究员 Nicolo Fusi、加州大学伯克利分校的 Jennifer Listgarten 和 Broad 研究所副主任 John Doench 合作研发,可在 CRISPR 编辑基因时预测脱靶效应。

那么何为“脱靶”?何为“CRISPR”?何为“基因编辑技术”?

首先,让我们来认识这项关键技术“CRISPR”(Clustered regularly interspaced short palindormic repeats),也被称为“CRISPR/Cas9 基因编辑技术”。

根据维基百科上的介绍来看,CRISPR 是存在于细菌中的一种基因组,该基因组中含有曾经攻击过该细菌的病毒的基因片段。细菌透过这些基因片段来侦测并抵抗相同病毒的攻击,并摧毁其 DNA 的特定部分。目前 Cas9 是首个被掌握且广泛应用的核酸酶。

该系统主要由两部分构成:一个负责剪切的 Cas9 蛋白,一个负责识别基因组中特定序列的“向导RNA”(sgRNA)。

通过该序列,科学家们可以准确且有效地编辑生命体内的部分基因(通俗来讲,就是在特定基因的特定位点切割和改变 DNA)。该技术可能会带来突破性应用,如改造细胞生产高产耐寒作物,甚至还可能帮助人类大规模消除癌症、艾滋等疾病。

机器学习预测脱靶效应

不知大家是够还记得 2017 年 5 月发表在《Nature Methods》杂志上的一篇题为“Unexpected mutations after CRISPR-Cas9 editing in vivo”的论文研究?尽管后续调查发现研究存在的实验漏洞导致了错误判断,但也侧面反映出 CRISPR/Cas9 基因编辑系统存在的技术安全上诸多挑战。

其中一个重要问题就是发生在基因组中的脱靶效应,不仅在其目标序列切割,还对相似序列进行切割,导致产生潜在突变及危害。这一现象被称为“脱靶效应”。

为此,研究人员现在有多种方法来改善这一问题。本文开头提到的 Elevation 工具正是试图通过机器学习手段予以预测。

首先,他们在生成的数据上训练出了第一层机器学习模型。这些数据报告了所有可能的靶向区域的活动,只有一个核苷酸与向导 RNA 不匹配。

然后,通过团队哈佛医学院和马塞诸塞州总医院附属医院给出的公开数据,机器学习专家训练了第二层模型,该模型将第一层模型改进并推广到模型存在多个错配核苷酸的案例中。

"第二个模型非常重要,因为脱靶效应可以发生在不止一次向导 RNA 与靶向 DNA 之间的错配",伯克利大学分校 Lisgarten 教授表示。在他看来,一些模型特征是直观的,例如向导 RNA 与核苷酸序列之间的错配问题。

最后,该团队在其他几个公开数据集上验证了他们的双层模型,这其中还包括哈佛医学院和马塞诸塞州总医院附属医院生成的数据集。

通过计算工具,研究人员可以输入他们想要修改的基因名称,搜索结果将反馈出预测的脱靶效应,研究人员据此再进行排序。研究人员面临的首要挑战是为特定的实验选择何种 RNA。在每个向导 RNA 上大约有 20 个核苷酸,因此在每组实验中,每个靶向 DNA 基因上都匹配有数百种潜在的向导 RNA。

目前 Elevation 和另一篇用于预测靶向效应的工具 Azimuth 合起来使用,现已开源代码。(链接:https://www.crispr.ml/)

一场始料未及的风波

实际上,“脱靶效应”这个早就让研究人员们“草木皆兵”的研究话题自始至终都没有妥善的解决方案,而今却因另一件尚未确认的“突破性”进展骤然掀起了世界范围内包括学术研究者在内的热议。

挑起人们兴趣的来源于 11 月 26 日的一则公开消息。

“一对基因经过修改的双胞胎婴儿已于 11 月健康诞生,基因编辑使她们将来可能具有天眼抵抗艾滋病的能力。这是世界首例免疫艾滋病的基因编辑婴儿,也意味着中国在基因编辑技术用于疾病预防领域实现历史性突破。”

来自中国深圳的科学家贺建奎在第二届国际人类基因组编辑峰会召开前一天表示。

图:贺建奎

然而,这个“历史性突破”却未迎来掌声,而是更多人对该起事件的谴责。就连该技术发明人 Jennifer Doudna 也紧急回应称:“假定今天( 26 日)的新闻得到证实,这使得对基因编辑技术的使用限制更为紧迫,我们应该限制对人类胚胎细胞的基因编辑仅仅用于确切的未被满足的医学需求。”

基因编辑技术,无论是用在人类医学、动植物育种还是药物筛选领域,都存在技术与伦理道德层面的双重考验。

那么如果在可接受的伦理道德和医学需求范围之内,研究人员对基因编辑技术的探索仍旧不会终止。

这不禁让笔者想起了“进击的巨人”中描述的那样:破墙而入捕食人类的巨人,实际上在数百年前是人类自己所创造。验的人工智能工程师水平。CSDN 百天计划课程共分为 3 个阶段,4 个月完成。扫描下方二维码可领取千元优惠券。

本文分享自微信公众号 - AI科技大本营(rgznai100)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-11-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

“看脸判断性取向”研究者:我们是为了让同性恋人群感到可能已经面临的风险

【新智元导读】斯坦福大学 Michal Kosinski 和 Yilun Wang 关于面部识别判断性取向的研究已经引起了巨大争议,但两位研究者在论文中所做的关...

31740
来自专栏新智元

【Nature重磅】扩散型忆阻器带来类脑计算大突破,或成神经计算机时代“晶体管”

【新智元导读】马萨诸塞大学阿默斯特分校研究人员研发出一种新型忆阻器,能够忠实模拟生物神经元突触的功能,相关论文日前在《自然-材料》发表。实验证明,与传统的漂移型...

49180
来自专栏华章科技

能从长相上看出性取向?这样的AI你怕不怕?

导读:八卦,似乎一直是人类茶余饭后一个永恒的话题,怎么辨别一个人与另一个人的关系?比如,是好朋友还是好基友?

43050
来自专栏AI科技大本营的专栏

坏了,人脸识别能检测出同性恋?

也许你已经听过了这一消息。去年,斯坦福大学的 助理教授 Michael Kosinki 和同事 Yilun Wang 在一篇论文中展示了人脸识别算法如何从图像...

17820
来自专栏企鹅号快讯

以假乱真:机器学习是怎么写出圣诞歌的?

日前,数据专家提姆·布什利用机器学习算法写了首圣诞歌词,让古老的圣诞节充满了浓浓的AI 特色。 ? 如何用大数据写出一首圣诞歌曲(来自Lynchpin) AI ...

22850
来自专栏吉浦迅科技

GPU运用电流协助找出人脑的庞大记忆容量

下次你忘记约会、放错钥匙或是记不起来某个人的名字,就不能再胡乱编个理由了:一项新的研究指出人脑的记忆容量达到 petabyte 等级,比起过去研究人员认为的数字...

29540
来自专栏互联网数据官iCDO

AI算法通过照片识别同性恋准确率超过人类,斯坦福大学研究惹争议

本文转载自机器之心 2016 年,上海交通大学的一篇论文《基于面部图像的自动犯罪概率推断》引起了极大的争议,被贴上了「歧视」的标签。近日,斯坦福大学在《Jour...

30150
来自专栏AI科技评论

独家 | 让城市不再与炸弹同眠:大数据​助力城市危险品管理

AI 科技评论按:距离 8·12 天津滨海新区爆炸事故已经过去了两周年。这起因危险品的不合理存放和管理导致的重大伤亡事故也让高校科研人员高度关注如何用大数据来防...

32270
来自专栏大数据文摘

可视化| 病毒在物种间触目惊心的传播

21890
来自专栏ATYUN订阅号

AI成为披萨师:MIT利用AI制作披萨食谱

AI可以帮助放射科医师诊断肺炎,预测您的音乐品味,甚至可以预测余震。而它也可以是一个非常强大的披萨师。

11210

扫码关注云+社区

领取腾讯云代金券