样本文件:
11:34:21.590434 IP 10.10.1.30 > 10.10.1.217: ICMP echo reply, id 27948, seq 1, length 64
在Python中,使用枚举函数很容易识别字段的数量。例如。
>>> i = '11:34:21.590434 IP 10.10.1.30 > 10.10.1.217: ICMP echo reply, id 27948, seq 1, length 64'
>>>
拆分字符串
>>> i.split()
['11:34:21.590434', 'IP', '10.10.1.30', '>', '10.10.1.217:', 'ICMP', 'echo', 'reply,', 'id', '27948,', 'seq', '1,', 'length', '64']
>>>
把它放在新变量上,比如说j
>>> j = i.split()
>>>
枚举它
>>> for i in enumerate(j, 1): i
...
(1, '11:34:21.590434')
(2, 'IP')
(3, '10.10.1.30')
(4, '>')
(5, '10.10.1.217:')
(6, 'ICMP')
(7, 'echo')
(8, 'reply,')
(9, 'id')
(10, '27948,')
(11, 'seq')
(12, '1,')
(13, 'length')
(14, '64')
>>>
所以,如果我想打印出带有awk的第3字段的源IP,这是非常容易的,而不是用肉眼手动识别它。
wolf@linux:~$ awk '{print $3}' file.txt
10.10.1.30
wolf@linux:~$
我知道在Linux/Bash中做类似的事情是可能的,我只是还不明白。
<#>更新
我知道使用NF
很容易获得列数
wolf@linux:~$ awk '{ print NF }' file.txt
14
wolf@linux:~$
但是我在这里想要实现的是识别每一列和它的数字。可能类似于Python枚举输出。
发布于 2021-01-31 08:11:38
可以使用AWK枚举这些字段:
awk '{ for (i = 1; i <= NF; i++) print i, $i }' file.txt
或者使用tr
和nl
:
tr ' ' '\n' < file.txt | nl
(如果要在第一行的末尾使用head -n1
筛选,则先通过tr
进行筛选;否则,将跨行计算字段。)
您还可以使用Bash数组(取决于IFS
)找到这一点:
arr=($(head -n1 file.txt))
i=0
while [[ i -lt ${#arr[@]} ]]; do
printf "%d %s\n" $((i+1)) "${arr[$i]}"
((i++))
done
发布于 2021-01-31 15:38:48
用GNU表示多个字符的RS
,\s
是[[:space:]]
的缩写:
$ awk -v RS='\\s+' '{print NR, $0}' file
1 11:34:21.590434
2 IP
3 10.10.1.30
4 >
5 10.10.1.217:
6 ICMP
7 echo
8 reply,
9 id
10 27948,
11 seq
12 1,
13 length
14 64
它假设你的输入中只有一行,就像你问题中的例子一样。
发布于 2021-01-31 08:30:31
希望这能有所帮助
$ tr ' ' '\n' < file.txt | nl
1 11:34:21.590434
2 IP
3 10.10.1.30
4 >
5 10.10.1.217:
6 ICMP
7 echo
8 reply,
9 id
10 27948,
11 seq
12 1,
13 length
14 64
$
或
$ read -ab < file.txt
$ for c in ${b[*]}; do echo $c; done | nl
1 11:34:21.590434
2 IP
3 10.10.1.30
4 >
5 10.10.1.217:
6 ICMP
7 echo
8 reply,
9 id
10 27948,
11 seq
12 1,
13 length
14 64
$
https://unix.stackexchange.com/questions/631875
复制相似问题