首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    三校集训Part1 QZEZ Day2 A洗牌 题解

    无聊的时间,小 K 喜欢和他的室友们一起打扑克(这副扑克很神奇,上面写着 1 到 n 的数字各一张),打扑克前当然要先洗牌啦。 宿舍洗牌的方式十分简单,先将所有牌平均分成两份,然后交叉地混合到一起,举个例子,六张牌 1 2 3 4 5 6 在混合后后会变成 1 4 2 5 3 6,但是这样的问题很明显,第一张牌和最后一张牌一定不会变化,所以他们还要将最后的 k 张牌移动到最前面,如此的过程,混合加上切牌,称为一次洗牌。 小 Y 并不信任小 K 的洗牌姿势,他决定让小 K 进行若干次洗牌后,检查其中某些牌牌面的数字,来确定小 K 是否手上抹油,他知道这样洗牌的结果是固定的,但却不知道应该是什么,你能帮帮他吗?

    01

    生信中常见的数据文件格式

    前面我们介绍了各种测序技术的原理:illumina、Sanger、第三代和第四代测序技术原理,我们测序得到的是带有质量值的碱基序列fastq格式,参考基因组是fasta格式。⽤⽐对⼯具把fastq格式的序列回帖到对应的fasta格式的参考基因组序列,就可以产⽣sam格式的⽐对⽂件。把sam格式的⽂本⽂件压缩成⼆进制bam⽂件可以节省空间。如果是记录某些位点或者区域碱基的变化,就是VCF⽂件格式。如果对参考基因组上⾯的各个区段标记它们的性质,⽐如哪些区域是外显⼦,内含⼦, UTR等等,这就是gtf/gff格式。如果只是为了单纯描述某个基因组区域,就是bed格式⽂件,记录染⾊体号以及起始终⽌坐标,正负链即可。

    03

    生信分析中常见的数据文件格式

    前面我们介绍了各种测序技术的原理:illumina、Sanger、第三代和第四代测序技术原理,我们测序得到的是带有质量值的碱基序列fastq格式,参考基因组是fasta格式。⽤⽐对⼯具把fastq格式的序列回帖到对应的fasta格式的参考基因组序列,就可以产⽣sam格式的⽐对⽂件。把sam格式的⽂本⽂件压缩成⼆进制bam⽂件可以节省空间。如果是记录某些位点或者区域碱基的变化,就是VCF⽂件格式。如果对参考基因组上⾯的各个区段标记它们的性质,⽐如哪些区域是外显⼦,内含⼦, UTR等等,这就是gtf/gff格式。如果只是为了单纯描述某个基因组区域,就是bed格式⽂件,记录染⾊体号以及起始终⽌坐标,正负链即可。

    01
    领券