首页
学习
活动
专区
工具
TVP
发布

三代测序-说

以分享三代测序数据分析流程为主,后期加入三代测序相关文章解读和复现
专栏作者
19
文章
12330
阅读量
19
订阅数
全长转录组 | 三代全长转录组分析流程(PacBio & ONT )-- Flair
今天我们介绍一款使用三代全长转录本数据进行转录本校正,聚类,可变剪切分析,定量和差异分析为一体的工具 - FLAIR。来自加利福尼亚大学圣克鲁斯分校(University of California,Santa Cruz)的Angela Brooks团队(图1)开发的全长可变转录本(isoform)分析工具FLAIR (Full-Length Alternative Isoform analysis of RNA),于2020年03月18号发表在《Nature Communications》杂志上,题目为 Full-length transcript characterization of SF3B1 mutation in chronic lymphocytic leukemia reveals downregulation of retained introns。该工具可用来鉴定高可信度转录本,差异剪切事件分析和差异转录本异构体(isoform)分析。
三代测序说
2024-04-12
2570
全长转录组 | 三代全长转录之circRNA(ONT )-- CIRI-long
目前研究表明,在生物体内,circRNA主要通过其序列特征,发挥miRNA海绵、RNA-binding proteins (RBPs)海绵以及翻译短肽等生物学功能(1-2)。因此,确定其的全长序列,是进行circRNA功能研究的重要基础。由于目前对于circRNA的研究多采用二代测序的方法,而circRNA的内部序列与线性mRNA分子高度相似,单纯通过算法(识别反向剪切位点)很难区分来自环形RNA和线性RNA分子的读段,以及确定全长circRNA内部组成。近期的研究中利用了长读长测序技术,对circRNA的全长重构进行了尝试(3-4)。因此,目前研究方法对于circRNA结构的识别能力主要被二代测序的读长所限制,对于长度较长(>500bp)的circRNA分子,仍然缺少有效的全长重构手段。
三代测序说
2024-04-07
1561
全长转录组 | PacBio 全长转录组测序的时代是否已经来了? Kinnex full-length RNA Kit测评
记得在我去新加坡参加 Nanopore Community Meeting 2023 回来后(2023年9月31日),PacBio发布了其全套 KINNEX 产品线,Kinnex single-cell RNA,Kinnex full-length RNA 和 Kinnex 16S rRNA 。 从2023年10月31日,PacBio宣布 Kinnex full-length RNA Kit 正式接受预定,到2023年3月24-25日左右,国内测序厂商宣布第一批测试数据下机,国内的用户可以开始尝试利用这项技术进行科学研究了。我也是盼到了,可以在能够接受的价格范围内尝试用PacBio全长转录组数据进行定量分析了(虽然还有是些小贵)。
三代测序说
2024-04-02
3292
全长转录组 | 三代全长转录组分析流程(PacBio & ONT )-- Bambu
今天我们继续介绍一款使用三代全长转录本数据进行转录本注释和定量的工具 - Bambu。来自新加坡科技研究局 (A-STAR) 的Jonathan Göke(图1)开发的长度长RNA-seq转录组分析工具Bambu,于2023年6月12日发表在《Nature Methods》杂志上,题目为Context-aware transcript quantification from long-read RNA-seq data with Bambu。该工具基于机器学习来识别和表征新转录本,从而能够对不同物种和样本进行适应性分析。
三代测序说
2024-03-12
3461
全长转录组 | 三代全长转录组分析流程(PacBio & ONT )-- IsoQuant
今天我们介绍一款使用三代全长转录本数据进行转录本注释和定量的工具 - IsoQuant。2023年1月2日,康奈尔大学医学院Hagen U. Tilgner团队和圣彼得堡国立大学Andrey D. Prjibelski团队合作在Nature Biotechnology(NBT)杂志发表题为 “Accurate isoform discovery with IsoQuant using long reads” 的文章 (图1)。作者开发了 IsoQuant -- 一款使用内含子图(intron graphs)的计算工具,在有参考基因组注释或者无参的情况下能够利用长度长序列准确重构转录本。对于新的转录本发现,IsoQuant 使Oxford Nanopore(ONT)数据在有参或无参模式下的假阳性率分别降低了5倍和2.5倍。IsoQuant 同时也提高了Pacific Biosciences数据的性能。
三代测序说
2024-02-22
3841
微生物全长16S | Full-length 16S Analysis -- PacBio Hifi Reads
16S核糖体RNA(16S ribosomal RNA),简称16S rRNA,是原核生物核糖体中30S亚基的组成部分。16S rRNA基因存在于所有细菌的基因组中,长度约为1542 bp,包括 10 个保守区(Conserved region)和 9 个可变区(Variable region),保守区反映了物种间的亲缘关系,而可变区则反映了物种间的差异 (图1)。 16S rRNA基因,其分子大小适中,突变率小,是细菌系统分类研究中最有用的和最常用的分子标志。通过16S扩增子高通量测序,检测16S rDNA可变区的序列变异和丰度,可了解样品中微生物群落多样性和丰度信息,在微生物分类鉴定、微生态研究等方面起着重要的作用。
三代测序说
2024-02-09
4681
全长转录组 | Oxford Nanopore (ONT) 三代全长转录组分析流程 -- 数据质控和预处理
ONT全长转录组测序是指基于牛津纳米孔公司(Oxford Nanopore Technologies,ONT)三代测序平台进行的全长转录组测序。利用三代测序平台长度长 (long-read)的特性,无需对转录本进行片段化,直接获取某一物种mRNA(或者有polyA尾的lncRNA)5'端到3'端的高质量全长转录组序列信息(图1),可准确识别可变剪接、基因融合、基因家族、可选择性多聚腺苷酸化 (alternative polyadenylation, APA)、等位基因特异性表达等转录本结构方面的变异。基于ONT三代测序平台进行全长转录组测序,除了可准确鉴别上述转录本结构变异,由于现阶段测序成本和通量(相对于PacBio平台),还可实现转录本(mRNA或polyA+ lncRNA)表达水平准确定量和差异分析。
三代测序说
2024-02-05
6720
全长转录组 | Iso-Seq 三代测序数据分析流程 (PacBio) (3)-- SQANTI3 v5.2
Functional IsoTranscriptomics (FIT) 是美国弗罗里达大学(University of Florida)Ana Conesa 教授团队(Genomics of Gene Expression Lab, ConesaLab)开发的在转录本isoform水平上进行生物信息学分析的流程,旨在提供一个全长转录组end-to-end的解决方案 (图1)。SQANTI 3 构成了FIT流程的第一个模块,其设计目的是使长读序列定义的转录组的质量控制和过滤成为可能,这些转录本通常含有artifacts和假阳性。因此,对全长转录组进行校正是进行FIT分析的前提,且对产生可靠的、在生物学上合理的结论/假设至关重要。SQANTI 3 是SQANTI 工具(发布)的最新版本,该版本合并 SQANT 1 和 SQANTI 2 中的功能并加入了新的功能 ,更好的对全长转录本进行深度表征 。
三代测序说
2024-01-27
6200
全长转录组 | Iso-Seq 三代测序数据分析流程 (PacBio) (2) -- pigeon
Isoseq 数据分析第一部分我们最后使用了isoseq cluster 获得了聚类后高质量的转录本,但是我们仍然不知道这些经过聚类的转录本在基因组的位置以及属于哪些基因?这些转录本是已经注释的还是新的isoform?每个聚类是否能够进一步合并?每个isoform的表达量情况?下面我们通过使用isoseq collapse和 pigeon对转录本(isoforms)进行在参考基因组指导下的进一步合并(collapse),注释,分类和定量。
三代测序说
2024-01-25
4250
全长转录组 | Iso-Seq 三代测序数据分析流程 (PacBio) (1)
很多物种的转录本非常多样和复杂,绝大多数真核生物基因不符合“一基因一转录本”的模式,这些基因往往存在多种可变剪切(Alternative splicing,AS)形式。目前,基于第二代测序技术的RNA测序(RNA-seq)技术已被广泛用于各种转录组研究。但其测序的序列读长较短(50-300bp),大多只能覆盖转录本的一小部分,导致难以精确重构同一转录本的同源异构体(isoform),因此使得二代RNA测序对于全长转录本的重构是不准确的,片面的。
三代测序说
2024-01-23
1.5K0
全基因组 - 人类基因组变异分析 (PacBio)(7)-- AnnotSV
基因组结构变异(structure variant, SV)是基因组变异的重要组成部分,大片段插入(Insertion, INS)、缺失(Deletion, DEL)、倒位(Inversion, INV)、易位(Translocation)、重复(Duplication, DUP)等类型的变异。第三代基因组测序因其读长较长,可轻松跨越重复区域和基因组复杂区域,能够更全面的检测基因组的SV。结构变异往往会对基因结构和表达产生更大的影响,在遗传病和肿瘤的发生发展中扮演了重要角色,因此发现和正确注释结构变异对于疾病的诊断有着至关重要的意义。
三代测序说
2023-12-09
4384
全基因组 - 人类基因组变异分析 (PacBio)(6)-- ANNOVAR
ANNOVAR是由王凯老师编写的一款用于SNP等变异位点注释的软件 (2),在注释软件(Annovar, SnpEff, VEP-Variant Effect Predictor)中相对引用较高。ANNOVAR能够利用最新的数据来分析各种基因组中的遗传变异。 给定一个包含染色体,起点,终点,参考核苷酸与检测核苷酸序列, ANNOVAR可以进行如下的功能注释:
三代测序说
2023-12-06
4320
全基因组 - 人类基因组变异分析(PacBio) -- minimap2 + Sniffles2
首先从github官网上下载minimap2的二进制文件压缩包,minimap2-2.26_x64-linux.tar.bz2,然后上传到服务器上。
三代测序说
2023-11-26
5750
全基因组 - 人类基因组变异分析(PacBio) (5)-- pbsv
染色体结构变异(Structure Variation, SV),指基因组上发生的长度大于50bp的大片段插入(Insertion, INS)、缺失(Deletion, DEL)、倒位(Inversion, INV)、易位(Translocation)、重复(Duplication, DUP)等类型的变异,其中占比最大的就是大片段的插入和缺失(图1)。插入缺失很好理解就是,多了一段或者少了一段DNA序列;重复就是有一段区域的序列重复出现;倒位就是序列翻转了一下,如本来那个位置该是AATTG的,结果变成了GTTAA;易位的话就是序列位置的变化,又进一步分为染色体内易位和染色体间易位。据统计,基因组结构变异可能导致的遗传性疾病已经超过1,000种,对于每个人来讲其基因组都有至少20,000个的结构变异,这些变异带来的影响或许比SNVs或InDels带来的影响更大。
三代测序说
2023-11-22
5010
三代测序 - Oxford Nanopore (ONT) 数据分析 - 数据质控和过滤
当前ONT测序质量虽然有很大的改善,但准确性依然不及二代测序,例如illumina或者BGIseq等。2018-2019年主流芯片R9.4 准确率对于2D reads为94%,1Dreads仅为86% ,如下图Fig.2b所示(1)。
三代测序说
2023-11-21
2.4K8
全基因组 - 人类基因组变异分析(PacBio) (4)-- DeepVariant
单核苷酸多态性(Single Nucleotide Polymorphism,SNP)指的是基因组中单个核苷酸腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)或鸟嘌呤(G)在物种成员之间或个体配对染色体之间的差异, 是最常见也最简单的一类造成基因组多样性的DNA序列变异。
三代测序说
2023-11-12
6070
全基因组 - 人类基因组变异分析(PacBio) (3)-- pbmm2
长读段比对算法与一代/二代测序数据的比对算法有很大的不同,因为长读段通常更长、包含更多错误和变异,并且需要更复杂的比对策略。
三代测序说
2023-10-26
6281
全基因组 - 人类基因组变异分析(PacBio) (2)-- CCS的使用
PacBio测序平台构建完成的测序文库形状就如同一个哑铃(Dumbell), 所以叫做SMRT bell,  图1右所示。其主要组成部分是:发卡状的接头(Hairpin Adapter)和双链DNA模板(Double Stranded DNA Template)。而文构建完成后、测序前还需要完成SMRT bell文库、Sequencing Primer、DNA Polymerase的混合工作(测序引物退火结合环装测序接头,然后引物-bell文库复合物结合DNA聚合酶,  图1右和图2所示。
三代测序说
2023-10-19
1.2K0
全基因组 - 人类基因组变异分析(PacBio) (1)
2022 年 4 月 1 日,赶在愚人节当天,《科学》杂志(Science)刊登系列文章,发表了国际 T2T 联盟攻克的首个人类基因组完成图(CHM13-T2T)研究成果,填补了此前几十年人类基因组研究留下的空白:大约 8% 的人类基因组序列「黑洞」,这些区域因为序列复杂性,一直无法被破译,尽管 2003 年国际人类基因组计划(HGP)曾经号称已经「完成了」人类基因组图谱绘制的工作。
三代测序说
2023-10-13
3412
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档