首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    生信中常见的数据文件格式

    前面我们介绍了各种测序技术的原理:illumina、Sanger、第三代和第四代测序技术原理,我们测序得到的是带有质量值的碱基序列fastq格式,参考基因组是fasta格式。⽤⽐对⼯具把fastq格式的序列回帖到对应的fasta格式的参考基因组序列,就可以产⽣sam格式的⽐对⽂件。把sam格式的⽂本⽂件压缩成⼆进制bam⽂件可以节省空间。如果是记录某些位点或者区域碱基的变化,就是VCF⽂件格式。如果对参考基因组上⾯的各个区段标记它们的性质,⽐如哪些区域是外显⼦,内含⼦, UTR等等,这就是gtf/gff格式。如果只是为了单纯描述某个基因组区域,就是bed格式⽂件,记录染⾊体号以及起始终⽌坐标,正负链即可。

    03

    高分辨率系统发育微生物群落剖析

    摘要:在过去十年中,在微生物群落分析方面,短读长高通量16S rRNA基因扩增子测序,已经使克隆依赖性长读长Sanger测序黯然失色。过渡到新技术提供了更多的定量信息,牺牲了分类分辨率,其具有推测各种生态系统中的代谢特征的意义。我们应用单分子实时测序进行微生物群落分析,获得全长16S rRNA基因序列的高通量,我们建议命名为PhyloTags。我们进行了基准测试,并通过应用到特定的微生物群落验证了这种方法。当进一步应用于来自Sakinaw湖的水柱样本时,我们发现,尽管门水平上,PhyloTag和Illumina V4 16S rRNA基因序列(iTags)群落结构的分析结果之间是可比较的,方差随着种群复杂性和水深的变化而增加。但是PhyloTag还允许较少的模糊分类。最后,关于平台的比较,PhyloTags和silicon产生的部分16S rRNA基因序列显示出群落的结构和系统发育分辨率跨多个分类级别的显著差异,包括严重的低估涉及氮和甲烷的特定微生物属的丰度,在湖泊的水柱。因此,PhyloTag提供了可靠的具有成本效益iTags的补充(adjuction)或替代方案,可实现更准确地对系统发育微生物群落的分解代谢潜力进行预测。

    05

    生信分析中常见的数据文件格式

    前面我们介绍了各种测序技术的原理:illumina、Sanger、第三代和第四代测序技术原理,我们测序得到的是带有质量值的碱基序列fastq格式,参考基因组是fasta格式。⽤⽐对⼯具把fastq格式的序列回帖到对应的fasta格式的参考基因组序列,就可以产⽣sam格式的⽐对⽂件。把sam格式的⽂本⽂件压缩成⼆进制bam⽂件可以节省空间。如果是记录某些位点或者区域碱基的变化,就是VCF⽂件格式。如果对参考基因组上⾯的各个区段标记它们的性质,⽐如哪些区域是外显⼦,内含⼦, UTR等等,这就是gtf/gff格式。如果只是为了单纯描述某个基因组区域,就是bed格式⽂件,记录染⾊体号以及起始终⽌坐标,正负链即可。

    01

    Genome Biology | 基于RNA-seq的孟德尔疾病变异分析

    今天给大家介绍的是沙特阿卜杜拉国王科技大学(KAUST)高欣教授课题组(http://sfb.kaust.edu.sa)发表在Genome Biology的一篇文章,“Analysis of transcript-deleterious variants in Mendelian disorders: implications for RNA-based diagnostic“。在全外显子组测序(Whole-exome sequencing, WES) 后,至少有50%的疑似孟德尔疾病患者仍未确诊,而未被WES捕获的非编码变体在多大程度上导致了这个比例还不清楚。全转录组测序(RNA-seq)是一种很有前途的WES的补充,但关于RNA分析对孟德尔疾病诊断的大规模贡献的经验数据很少。在这个研究中,作者对疑似孟德尔疾病的5647个家族进行了研究,描述了关于“转录有害变异(transcript-deleterious variants,TDVs)”的经验,为即将实施的RNA-seq结合基因组测序的临床诊断提供了非常需要的经验数据。

    06
    领券