文章/答案/技术大牛

发布

社区首页 >问答首页 >仅替换第N列中的所有双引号

问仅替换第N列中的所有双引号
EN

Stack Overflow用户

提问于 2021-07-27 22:58:36

回答 3查看 67关注 0票数 1

我有一个这样的文件

abc|def||ghi|jklm||uv||xyz
abc|def||ghi|jklm|nopqrst|uv||xyz
abc|def||ghi|jklm|nopq"rst|uv||xyz
abc|def||ghi|jklm|"nopqrst"|uv||xyz
abc|def||ghi|jklm|"nopq"rst"|uv||xyz
abc|def||ghi|jklm|"nopq"r"st"|uv||xyz

第六列可以双引号。我希望将此字段中出现的所有双引号替换为反斜杠-双引号(\")

我希望我的输出看起来像这样

abc|def||ghi|jklm||uv||xyz
abc|def||ghi|jklm|nopqrst|uv||xyz
abc|def||ghi|jklm|nopq\"rst|uv||xyz
abc|def||ghi|jklm|"nopqrst"|uv||xyz
abc|def||ghi|jklm|"nopq\"rst"|uv||xyz
abc|def||ghi|jklm|"nopq\"r\"st"|uv||xyz

我尝试了下面的组合，但每次都以短结尾

sed -i 's/\"/\\\"/2' file.txt (this replaces only 2nd occurrence)
sed -i 's/\"/\\\"/2g' file.txt (this replaces only 2nd occurrence and all rest also)

我的文件将有数百万行；因此我可能只需要sed或awk命令。请帮帮忙。

linux

awk

sed

replace

回答 3

Stack Overflow用户

回答已采纳

发布于 2021-07-27 23:02:55

您可以在任何版本的awk中使用此awk解决方案

awk 'BEGIN {FS=OFS="|"} {
   c1 = substr($6, 1, 1)
   c2 = substr($6, length($6), 1)
   s = substr($6, 2, length($6)-2)
   gsub(/"/, "\\\"", s)
   $6 = c1 s c2
} 1' file

abc|def||ghi|jklm||uv||xyz
abc|def||ghi|jklm|nopqrst|uv||xyz
abc|def||ghi|jklm|nopq\"rst|uv||xyz
abc|def||ghi|jklm|"nopqrst"|uv||xyz
abc|def||ghi|jklm|"nopq\"rst"|uv||xyz
abc|def||ghi|jklm|"nopq\"r\"st"|uv||xyz

票数 4

Stack Overflow用户

发布于 2021-07-28 00:38:41

如果这不是您需要的全部，那么编辑您的问题，以提供更具代表性的样本输入/输出，包括不适用于此的情况：

$ sed 's/"/\\"/g; s/|\\"/|"/g; s/\\"|/"|/g' file
abc|def||ghi|jklm||uv||xyz
abc|def||ghi|jklm|nopqrst|uv||xyz
abc|def||ghi|jklm|nopq\"rst|uv||xyz
abc|def||ghi|jklm|"nopqrst"|uv||xyz
abc|def||ghi|jklm|"nopq\"rst"|uv||xyz
abc|def||ghi|jklm|"nopq\"r\"st"|uv||xyz

上面的代码可以在任何sed中运行。

票数 4

Stack Overflow用户

发布于 2021-07-28 00:24:38

这可能适用于您(GNU sed)：

sed -E 's/[^|]*/\n&\n/6            # isolate the 6th field
        h                          # make a copy
        s/"/\\"/g                  # replace " by \"
        s/\\(")\n|\n\\(")/\1\n\2/g # repair start and end "s
        H                          # append amended line to copy
        g                          # get copies to current line
        s/\n.*\n(.*)\n.*\n(.*)\n.*/\2\1/' file # swap fields

用换行符包围第六个字段，并在保留空间中复制一份。

将所有"替换为\"，如果字段以\开头和结尾，则删除字段开头和结尾的"

将修改后的行追加到副本中，并将当前行替换为双倍行。

使用模式匹配将复制的第6行字段替换为修改后的字段。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/68547249

复制

相似问题

问仅替换第N列中的所有双引号
EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问仅替换第N列中的所有双引号EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问仅替换第N列中的所有双引号
EN