首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

AI模型鉴别RNA编辑位点!GB|复旦大学杨力:开发基于深度学习的计算分析框架实现测序数据直接鉴别RNA编辑与DNA突变位点

来自复旦大学“生命健康"领域最新的科研进展。面向世界科技前沿,践行行业使命感,助力基础研究,推广科技成果。服务行业,造福社会!

人类转录组中存在大量的RNA突变信息,其主要是人腺苷脱氨酶(ADAR)催化的腺苷(A)到肌苷(I)的RNA编辑(A-to-I RNA editing, REs),如何能从海量转录组数据中排除测序错误、比对错误以及DNA突变等信息的干扰,有效且精准地识别这些RNA编辑位点是转录组计算生物学领域的研究难点

2024年10月8日(当地时间),复旦大学生物医学研究院杨力研究组,于期刊Genome Biology发表题为“DEMINING: a deep learning model embedded framework to distinguish RNA editing from DNA mutations in RNA sequencing data”的论文。该研究发布了一套新型计算分析框架——DEMINING可以从RNA测序数据直接鉴别RNA编辑与DNA突变位点

近期,以深度学习为代表的人工智能方法,在各个领域展现出强大的应用前景,为解决如何从RNA测序数据中精确区分RNA编辑与DNA突变的这一难题提供了新的思路。该研究开发的DEMINING流程(图1),通过深度学习模型DeepDDR实现从RNA测序数据中高效准确地识别RNA编辑和DNA突变。DEMINING流程首先通过严格的筛选标准去除转录组数据中的测序和比对错误(图1a),然后将获得的高可信度(DNA和RNA)突变位点信息作为输入,通过搭建的深度学习模型DeepDDR实现DNA突变和RNA编辑的精准区分(图1b)。

图1. 开发用于DNA突变(DMs)和RNA编辑位点(REs)分类的DEMINING框架及嵌入式DeepDDR模型

在DeepDDR模型的训练过程中,研究团队从403个配套的RNA测序和DNA测序数据集中提取了122,872个高可信度的RNA编辑位点和相同数量的DNA突变位点,分别用于训练、验证和测试模型。在该模型构建过程中,研究人员创新性的将突变位点上下游序列和测序读段编码,构建带注意力的双碱基上下文共轭同频矩阵(matrix of the co-occurrence frequencies of each mutation site with its context bases, CMC),作为DeepDDR模型的编码输入,接着通过使用多个层次的卷积和池化操作,提取出突变位点周围的序列以及读段比对特征,通过这种方法DeepDDR模型不仅能够识别出突变位点还能够捕捉到这些突变在更大范围内的上下文信息这可能是有效区分RNA编辑和DNA突变的关键所在

DEMINING框架不仅在人类样本中表现出色经过小样本迁移学习还可应用于非灵长类的RNA测序样本展现了DEMINING框架广泛的应用潜力。在迁移学习过程中,研究团队将人类数据集上训练的DeepDDR模型作为预训练模型,进一步利用小鼠脑组织的RNA测序数据进行微调。通过这种方法,DeepDDR模型在小鼠数据集上的RNA编辑识别准确性得到了显著提高。相似的改进也在其他非灵长类物种(线虫)的数据集中得到了验证,表明DEMINING框架的可迁移性和广泛适用性。

最后,科研人员探索了利用DEMINING框架从已发表的人类RNA测序数据中直接鉴别DNA突变的应用。在分析急性髓性白血病(AML)患者的RNA测序数据时,DEMINING识别出了大量此前未报道的可能与疾病相关的DNA突变和RNA编辑位点。这些突变与宿主基因的上调表达或新抗原的产生相关为AML的发病机制提供了新的见解

综上DEMINING框架通过嵌入的深度学习模型DeepDDR实现了从RNA测序数据中高效精确地鉴定RNA编辑和DNA突变。随着RNA测序数据的不断积累,特别是与疾病相关的转录组数据,DEMINING框架有望在更广泛的人类疾病RNA测序样本中应用,揭示更多与疾病相关的突变和基因为诊断和治疗提供潜在靶点。DEMINING的构建是利用人工智能模型在转录组分析中的有一有效尝试。2024年10月3日,杨力研究员也受邀与国际同行为Molecular Cell撰写相关Voices(https://www.cell.com/molecular-cell/abstract/S1097-2765(24)00693-2),展望人工智能时代转录组RNA系统分析研究的发展趋势(Yang et al, Molecular Cell 2024)。

注:文中插图源于  Genome Biology

来    源       复旦大学生物医学研究院

近期活动

近期进展

关于光华

复旦大学光华生命健康校友会”是复旦大学校友总会正式注册成立的分支机构,是跨学科、跨界别、跨地域,覆盖生命健康领域的公益性行业校友组织。

校友会以推动中国生命健康领域的“科技创新”,提升人类健康为使命,以促进“产学研医用”的融合创新与资源整合为目标,以加强母校与校友联动,增进校友互助协作,发掘科技创新成果,助力母校发展、助力校友成功、助力行业进步、造福社会大众为为宗旨

校友会立足上海、辐射全国,会员以复旦大学生命科学、医学、药学、附属医院校友为基础,同时覆盖化学、材料、信息、大数据、金融、管理等多学科泛生命健康相关院系,涵盖产业、学术、科研、医疗、政府、资本等“产学研医政资”的优秀校友。

有意入会的校友,可以填写以下申请表。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OQZNakUSHTjcOaPsO_ZS12Sw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券