我有一个模式文件(fileA.txt),需要在一个大文件(fileB.txt)中搜索它,并且需要用另一个文件(fileC.txt)示例中的模式替换它们:
fileB.txt
4472534
8BC4232
3533221
333553D
8645141
2412AAA我想在fileB中搜索这个模式:
fileA.txt
BC423
33221
12AAA然后,我想用fileC中的模式逐行替换它们:
fileC.txt
66FF7
11GYT
2HHJK预期产出:
4472534
866FF72
3511GYT
333553D
8645141
242HHJK我写了这样的东西:
grep -f fileA.txt fileB.txt | xargs sed -i fileC.txt然而,它正确地搜索模式,但替代可能是不正确的。有什么建议吗?
fileA (pattern to search)
CAAGATTTTCTTTGCCGAGACTCAGTGGGG
fileB
>AMP_4 RS0255 CENPF__ENST00000366955.7__6322__30__0.43333__69.25__1 RS0247
CAGTTGTGCAATTTGGTTTTCCAGCTCACA
>AMP_4 RS0451 CENPF__ENST00000366955.7__10108__30__0.5__71.1396__1 RS0247
GAAGCCTGCAGCCCTCACTGGAAATAAACA
>AMP_4 RS0451 CENPF__ENST00000366955.7__9236__30__0.5__69.816__1 RS0332
CAAGATTTTCTTTGCCGAGACTCAGTGGGG
>AMP_4 RS0451 CENPF__ENST00000366955.7__8140__30__0.43333__68.033__1RS0255
GAGCTCCTTCAATTGATCTTTGCTGCTCTT
fileC (pattern to replace)
GGAGGATGGTGCCTGAATCTACTGGGCTCC发布于 2021-02-12 15:41:15
这可能适用于您(GNU和并行):
parallel echo 's/{1}/{2}/' ::::+ file[AC] | sed -f - fileB构建一个sed脚本,然后以fileB作为输入运行脚本。
注:::::+模拟粘贴命令,{1}和{2}模拟fileA和fileC中每一行的值。
https://stackoverflow.com/questions/66168741
复制相似问题