我刚刚开始学习使用命令行。希望这不是一个垃圾问题。
我的目录中有以下文件:
L001_R1_001.fastq
L002_R2_001.fastq
L004_R1_001.fastq
L005_R2_001.fastq
L001_R2_001.fastq
L003_R1_001.fastq
L004_R2_001.fastq
L006_R1_001.fastq
L002_R1_001.fastq
L003_R2_001.fastq
L005_R1_001.fastq
L006_R2_001.fastq你可以在文件名中看到,它是R1和R2的混合,L00后面的数字没有排序。
我想按照文件名的顺序连接文件,分别用于R1和R2文件。
如果我手动完成,它将如下所示:
# for R1 files
cat L001_R1_001.fastq L002_R1_001.fastq L003_R1_001.fastq L004_R1_001.fastq L005_R1_001.fastq L006_R1_001.fastq > R1.fastq
# for R2 files
cat L001_R2_001.fastq L002_R2_001.fastq L003_R2_001.fastq L004_R2_001.fastq L005_R2_001.fastq L006_R2_001.fastq > R2.fastq你能帮我写一个我以后可以重用的脚本吗?谢谢!
发布于 2013-10-16 02:43:35
cat `ls -- *_R1_*.fastq | sort` >R1.fastq
cat `ls -- *_R2_*.fastq | sort` >R2.fastq在大多数系统上不需要| sort,因为ls按名称对文件进行排序。
如果文件名包含空格,则首先执行以下操作:
IFS='
'发布于 2013-10-16 02:44:37
尝试使用通配符*。它将自动按字母顺序展开文件名。
cat L*_R1_001.fastq > R1.fastq
cat L*_R2_001.fastq > R2.fastq编辑:
如果上面的命令没有提供所需的排序,请尝试按照Fredrik Pihl的建议使用LC_ALL=C覆盖区域设置
LC_ALL=C cat L*_R1_001.fastq > R1.fastqhttps://stackoverflow.com/questions/19388646
复制相似问题