我是使用conda安装的这个软件,首先激活虚拟环境
conda activate download_raw_data
下载
prefetch SRR10193119
image.png
默认是保存在 ncbi 文件夹下,这个相对还是挺快的,2.5个G,4分钟左右就下载好了
这样是sra格式的数据,还需要借助 fasterq-dump转换成 fastq
fasterq-dump --split-files SRR10193119.sra
image.png
下载的时候也可以指定数据类型
prefetch --type fastq -O ./ SRR8502595
但是好像不管用,还是sra格式的数据 -O 指定下载文件的存储位置
找到了一个在线工具,直接上传 geneid 就可以 , 链接是 http://wheat.cau.edu.cn/TGT/m3/?navbar=Home
image.png
工具对应的论文
A Collinearity-Incorporating Homology Inference Strategy for Connecting Emerging Assemblies in the Triticeae Tribe as a Pilot Practice in the Plant Pangenomic Era
image.png
没太看明白论文的研究内容是啥,还得多看几遍
说回富集分析
image.png
这个看起来好像是shiny应用,出结果还能画图,但是结果图不太好看的话,我们可以自己来画,模仿clusterProfiler的结果
如何画有时间再来研究吧
欢迎大家关注我的公众号
小明的数据分析笔记本
小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!