前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【linux命令讲解大全】051.Linux Awk脚本语言中的字段定界符和流程控制

【linux命令讲解大全】051.Linux Awk脚本语言中的字段定界符和流程控制

作者头像
全栈若城
发布2024-03-02 13:15:16
770
发布2024-03-02 13:15:16
举报
文章被收录于专栏:若城技术专栏若城技术专栏

设置字段定界符

默认的字段定界符是空格,可以使用-F “定界符” 明确指定一个定界符:

代码语言:javascript
复制
awk -F: '{ print $NF }' /etc/passwd
# 或
awk 'BEGIN{ FS=":" } { print $NF }' /etc/passwd

在BEGIN语句块中则可以用OFS=“定界符”设置输出字段的定界符。

流程控制语句

在linux awk的while、do-while和for语句中允许使用break,continue语句来控制流程走向,也允许使用exit这样的语句来退出。break中断当前正在执行的循环并跳到循环外执行下一条语句。if 是流程选择用法。awk中,流程控制语句,语法结构,与c语言类型。有了这些语句,其实很多shell程序都可以交给awk,而且性能是非常快的。下面是各个语句用法。

条件判断语句
代码语言:javascript
复制
if(表达式)
  语句1
else
  语句2

格式中语句1可以是多个语句,为了方便判断和阅读,最好将多个语句用{}括起来。awk分枝结构允许嵌套,其格式为:

代码语言:javascript
复制
if(表达式)
  {语句1}
else if(表达式)
  {语句2}
else
  {语句3}

示例:

代码语言:javascript
复制
awk 'BEGIN{
test=100;
if(test>90){
  print "very good";
  }
  else if(test>60){
    print "good";
  }
  else{
    print "no pass";
  }
}'

输出:

代码语言:javascript
复制
very good

每条命令语句后面可以用; 分号 结尾。

循环语句
while语句
代码语言:javascript
复制
while(表达式)
  {语句}

示例:

代码语言:javascript
复制
awk 'BEGIN{
test=100;
total=0;
while(i<=test){
  total+=i;
  i++;
}
print total;
}'

输出:

代码语言:javascript
复制
5050
for循环

for循环有两种格式:

格式1:

代码语言:javascript
复制
for(变量 in 数组)
  {语句}

示例:

代码语言:javascript
复制
awk 'BEGIN{
for(k in ENVIRON){
  print k"="ENVIRON[k];
}

}'

输出:

代码语言:javascript
复制
TERM=linux
G_BROKEN_FILENAMES=1
SHLVL=1
pwd=/root/text
...
logname=root
HOME=/root
SSH_CLIENT=192.168.1.21 53087 22

注:ENVIRON是awk常量,是子典型数组。

格式2:

代码语言:javascript
复制
for(变量;条件;表达式)
  {语句}

示例:

代码语言:javascript
复制
awk 'BEGIN{
total=0;
for(i=0;i<=100;i++){
  total+=i;
}
print total;
}'

输出:

代码语言:javascript
复制
5050
do循环
代码语言:javascript
复制
do
{语句} while(条件)

例子:

代码语言:javascript
复制
awk 'BEGIN{ 
total=0;
i=0;
do {total+=i;i++;} while(i<=100)
  print total;
}'

输出:

代码语言:javascript
复制
5050
其他语句
  • break 当 break 语句用于 while 或 for 语句时,导致退出程序循环。
  • continue 当 continue 语句用于 while 或 for 语句时,使程序循环移动到下一个迭代。
  • next 能能够导致读入下一个输入行,并返回到脚本的顶部。这可以避免对当前输入行执行其他的操作过程。
  • exit 语句使主输入循环退出并将控制转移到END,如果END存在的话。如果没有定义END规则,或在END中应用exit语句,则终止脚本的执行。

数组应用

数组是awk的灵魂,处理文本中最不能少的就是它的数组处理。因为数组索引(下标)可以是数字和字符串在awk中数组叫做关联数组(associative arrays)。awk 中的数组不必提前声明,也不必声明大小。数组元素用0或空字符串来初始化,这根据上下文而定。

数组的定义

数字做数组索引(下标):

代码语言:javascript
复制
Array[1]="sun"
Array[2]="kai"

字符串做数组索引(下标):

代码语言:javascript
复制
Array["first"]="www"
Array"[last"]="name"
Array["birth"]="1987"

使用中print Array[1]会打印出sun;使用print Array[2]会打印出kai;使用print[“birth”]会得到1987。

读取数组的值
代码语言:javascript
复制
{ for(item in array) {print array[item]}; }       #输出的顺序是随机的
{ for(i=1;i<=len;i++) {print array[i]}; }         #Len是数组的长度
数组相关函数

得到数组长度:

代码语言:javascript
复制
awk 'BEGIN{info="it is a test";lens=split(info,tA," ");print length(tA),lens;}'

输出:

代码语言:javascript
复制
4 4

length返回字符串以及数组长度,split进行分割字符串为数组,也会返回分割得到数组长度。

代码语言:javascript
复制
awk 'BEGIN{info="it is a test";split(info,tA," ");print asort(tA);}'

输出:

代码语言:javascript
复制
4

asort对数组进行排序,返回数组长度。

输出数组内容(无序,有序输出):

代码语言:javascript
复制
awk 'BEGIN{info="it is a test";split(info,tA," ");for(k in tA){print k,tA[k];}}'

输出:

代码语言:javascript
复制
4 test
1 it
2 is
3 a 

for…in输出,因为数组是关联数组,默认是无序的。所以通过for…in得到是无序的数组。如果需要得到有序数组,需要通过下标获得。

代码语言:javascript
复制
awk 'BEGIN{info="it is a test";tlen=split(info,tA," ");for(k=1;k<=tlen;k++){print k,tA[k];}}'

输出:

代码语言:javascript
复制
1 it
2 is
3 a
4 test

注意:数组下标是从1开始,与C数组不一样。

判断键值存在以及删除键值:

错误的判断方法:

代码语言:javascript
复制
awk 'BEGIN{tB["a"]="a1";tB["b"]="b1";if(tB["c"]!="1"){print "no found";};for(k in tB){print k,tB[k];}}' 

输出:

代码语言:javascript
复制
no found
a a1
b b1
c

以上出现奇怪问题,tB[“c”]没有定义,但是循环时候,发现已经存在该键值,它的值为空,这里需要注意,awk数组是关联数组,只要通过数组引用它的key,就会自动创建改序列。

正确判断方法:

代码语言:javascript
复制
awk 'BEGIN{tB["a"]="a1";tB["b"]="b1";if( "c" in tB){print "ok";};for(k in tB){print k,tB[k];}}'  

输出:

代码语言:javascript
复制
a a1
b b1

if(key in array)通过这种方法判断数组中是否包含key键值。

删除键值:

代码语言:javascript
复制
awk 'BEGIN{tB["a"]="a1";tB["b"]="b1";delete tB["a"];for(k in tB){print k,tB[k];}}'                     

输出:

代码语言:javascript
复制
b b1

delete array[key]可以删除,对应数组key的,序列值。

二维、多维数组使用

awk的多维数组在本质上是一维数组,更确切一点,awk在存储上并不支持多维数组。awk提供了逻辑上模拟二维数组的访问方式。例如,array[2,4]=1这样的访问是允许的。awk使用一个特殊的字符串SUBSEP(�34)作为分割字段,在上面的例子中,关联数组array存储的键值实际上是2�344。

类似一维数组的成员测试,多维数组可以使用if ( (i,j) in array)这样的语法,但是下标必须放置在圆括号中。类似一维数组的循环访问,多维数组使用for ( item in array )这样的语法遍历数组。与一维数组不同的是,多维数组必须使用split()函数来访问单独的下标分量。

代码语言:javascript
复制
awk 'BEGIN{
for(i=1;i<=9;i++){
  for(j=1;j<=9;j++){
    tarr[i,j]=i*j; print i,"*",j,"=",tarr[i,j];
  }
}
}'

输出:

代码语言:javascript
复制
1 * 1 = 1
1 * 2 = 2
1 * 3 = 3
1 * 4 = 4
1 * 5 = 5
1 * 6 = 6 
...
9 * 6 = 54
9 * 7 = 63
9 * 8 = 72
9 * 9 = 81

可以通过array[k,k2]引用获得数组内容。

另一种方法:

代码语言:javascript
复制
awk 'BEGIN{
for(i=1;i<=9;i++){
  for(j=1;j<=9;j++){
    tarr[i,j]=i*j;
  }
}
for(m in tarr){
  split(m,tarr2,SUBSEP); print tarr2[1],"*",tarr2[2],"=",tarr[m];
}
}'
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2024-02-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 设置字段定界符
    • 流程控制语句
      • 条件判断语句
      • 循环语句
      • 其他语句
    • 数组应用
      • 数组的定义
      • 读取数组的值
      • 数组相关函数
      • 二维、多维数组使用
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档