tophat2+cufflinks转录组测序实例(2)——原始数据的处理

1.利用SRA toolkit 将sra文件解压为fastq文件

[tophat2+cufflinks转录组测序实例——原始数据的获取] (http://www.biocoder.cn/content/62/) 我们在NCBI上获取的数据 要想把下载的原始数据以sra格式结尾的文件给tophat2识别并进行比对,就要将sra格式解压为fastq格式 SRA toolkit 代码如下

fastq-dump --split-files SRR5399538.sra

将4个sra文件分别解压为fastq文件

2.利用bowtie2建立参考基因组的索引

代码如下

bowtie2-build GCA_000009725.1_ASM972v_genomic.fna GCA_000009725.1_ASM972v1_genomic

建立后的索引文件如图

全文结束,欢迎在评论区讨论~

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI深度学习求索

CAM实践:基于pytorch的使用方法

注意:如果为了快一点,不使用网络的图片以及文件的话,记得更改图片地址和已下载文件地址哦

74950
来自专栏JAVA高级架构

为什么你要使用这么强大的分布式消息中间件——kafka

这些场景都有一个共同点: 数据是由上游模块产生,上游模块,使用上游模块的数据计算、统计、分析,这个时候就可以使用消息系统,尤其是分布式消息系统!

20240
来自专栏Spark学习技巧

海量数据处理之bitmap

本文将讲述Bit-Map算法的相关原理,Bit-Map算法的一些利用场景,例如BitMap解决海量数据寻找重复、判断个别元素是否在海量数据当中等问题.最后说说B...

18720
来自专栏祝威廉

SQL还是那个SQL么?

今天MLSQL群里有个小伙伴问到,能把Spark, Flink 这些框架运行在黑莓上么? 我回答道:可以作为一个内置SQL计算引擎嵌入(不是数据库),其他可能...

8530
来自专栏钱塘大数据

中国天眼年薪10万招不到科研人才,究竟讽刺了谁?

10月29日,科技日报头版头条刊登了一篇意味深长的新闻——《FAST验收在即,已启动新一轮招聘,“中国天眼”10万年薪难觅驻地科研人才》。

16910
来自专栏铭毅天下

干货 | 2018 Elastic 中国开发者大会笔记

Elastic 中国开发者大会2018,干货满满。已然成为Elastic技术爱好者的狂欢日。

20820
来自专栏aoho求索

由散列表到BitMap的概念与应用(三):海量数据处理

遍历文件a,对每个url求取hash(url)%1000,然后根据所取得的值将url分别存储到1000个小文件(记为a0,a1,…,a999,每个小文件约300...

17210
来自专栏Python数据科学

这种 “交互可视化” 效果不要太赞了(配有动态展示)

本文介绍了如何在Jupyter Notebook中创建交互内容。所谓内容,主要指可视化内容。不过我们很快就会看到,这里的可视化内容不仅包括通常的图表,还包括有助...

79030
来自专栏孟永辉

当新零售成为互联网家装的新标签,新家装如何才能避免沦为概念?

越来越多的迹象开始表明,互联网家装的概念已经难以再对当下的家装行业进化起到推动作用。家装行业需要一场全新变革,才能满足消费升级时代的用户需求,真正将家装行业的发...

9420
来自专栏京东技术

塞伯坦 | 提高业务研发效率的工程化解决方案

http://cyb.hestudy.com/,面向前端模块化工程的构建工具。主要目的是帮助开发者统一前端开发模式和项目开发结构,提高功能扩展和降低维护成本,自...

20220

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励