在Shell编程工具中,四剑客工具的使用更加的广泛,Shell编程四剑客包括:find、sed、grep、awk,熟练掌握四剑客会对Shell编程能力极大的提升。
四剑客之Find工具实战,Find工具主要用于操作系统文件、目录的查找,其语法参数格式为:
find path -option [ -print ] [ -exec -ok command ] { } \; |
---|
其option常用参数详解如下:
-name filename #查找名为filename的文件;-type b/d/c/p/l/f #查是块设备、目录、字符设备、管道、符号链接、普通文件;-size n[c] #查长度为n块[或n字节]的文件;-perm #按执行权限来查找;-user username #按文件属主来查找; |
---|
find /data/ -name “*.txt” #查找/data/目录以.txt结尾的文件;find /data/ -name “[A-Z]*” #查找/data/目录以大写字母开头的文件;find /data/ -name “test*” #查找/data/目录以test开头的文件; |
---|
find /data/ -type d #查找/data/目录下的文件夹;find /data/ ! -type d #查找/data/目录下的非文件夹;find /data/ -type l #查找/data/目录下的链接文件。find /data/ -type d|xargs chmod 755 -R #查目录类型并将权限设置为755;find /data/ -type f|xargs chmod 644 -R #查文件类型并将权限设置为644; |
---|
find /data/ -size +1M #查文件大小大于1Mb的文件;find /data/ -size 10M #查文件大小为10M的文件;find /data/ -size -1M #查文件大小小于1Mb的文件; |
---|
02Shell编程四剑客之SED
SED是一个非交互式文本编辑器,它可对文本文件和标准输入进行编辑,标准输入可以来自键盘输入、文本重定向、字符串、变量,甚至来自于管道的文本,与VIM编辑器类似,它一次处理一行内容,Sed可以编辑一个或多个文件,简化对文件的反复操作、编写转换程序等。
在处理文本时把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),紧接着用SED命令处理缓冲区中的内容,处理完成后把缓冲区的内容输出至屏幕或者写入文件。
逐行处理直到文件末尾,然而如果打印在屏幕上,实质文件内容并没有改变,除非你使用重定向存储输出或者写入文件。其语法参数格式为:
sed [-Options] [‘Commands’] filename;sed工具默认处理文本,文本内容输出屏幕已经修改,但是文件内容其实没有修改,需要加-i参数即对文件彻底修改;x #x为指定行号;x,y #指定从x到y的行号范围;/pattern/ #查询包含模式的行;/pattern/pattern/ #查询包含两个模式的行;/pattern/,x #从与pattern的匹配行到x号行之间的行;x,/pattern/ #从x号行到与pattern的匹配行之间的行;x,y! #查询不包括x和y行号的行;r #从另一个文件中读文件;w #将文本写入到一个文件;y #变换字符;q #第一个模式匹配完成后退出;l #显示与八进制ASCII码等价的控制字符; |
---|
常用SED工具企业演练案列:
sed ‘s/old/new/g’ jfedu.txt |
---|
sed -n ‘1,3p’ jfedu.txt |
---|
sed -n ‘1p;$p’ jfedu.txt |
---|
sed ‘1,3d’ jfedu.txtsed ‘/jfedu/,$d’ jfedu.txt |
---|
for i in `seq 1 6`;do sed -i ‘$d’ jfedu.txt ;donesed ‘$d’ jfedu.txt |
---|
sed ‘$d’ jfedu.txt |
---|
通常而言,SED将待处理的行读入模式空间,脚本中的命令逐行进行处理,直到脚本执行完毕,然后该行被输出,模式空间请空;然后重复刚才的动作,文件中的新的一行被读入,直到文件处理完备。
如果用户希望在某个条件下脚本中的某个命令被执行,或者希望模式空间得到保留以便下一次的处理,都有可能使得sed在处理文件的时候不按照正常的流程来进行。这时可以使用SED高级语法来满足用户需求。总的来说,SED高级命令可以分为三种功能:
sed ‘/^$/d;G’ jfedu.txtsed ‘/^$/d;G;G’ jfedu.txtsed ‘/^$/d;1,3G;’ jfedu.txt |
---|
sed ‘n;d’ jfedu.txtsed ‘n;n;d’ jfedu.txt |
---|
sed ‘/jfedu/{x;p;x;}’ jfedu.txtsed ‘/jfedu/G’ jfedu.txtsed ‘/jfedu/{x;p;x;G;}’ jfedu.txt |
---|
sed ‘/^$/d;G’ jfedu.txt |
---|
sed ‘/^$/d;G’ jfedu.txt |
---|
sed = jfedu.txt| sed ‘N;s/\n/ /’sed = jfedu.txt| sed ‘N;s/\n/\t/’sed = jfedu.txt| sed ‘N;s/\n/\./’ |
---|
sed ‘s/^[ \t]*//;s/[ \t]*$//’ jfedu.txt |
---|
sed -n ‘/old/,/new/’p jfedu.txt |
---|
sed ‘$!N;$!D’ jfedu.txtsed ‘N;$!P;$!D;$d’ jfedu.txt |
---|
sed ‘$!N;s/\n/ /’ jfedu.txtsed ‘N;s/\n/ /’ jfedu.txt |
---|
03Shell编程四剑客之AWK
AWK是一个优良的文本处理工具,Linux及Unix环境中现有的功能最强大的数据处理引擎之一,以Aho、Weinberger、Kernighan三位发明者名字首字母命名为AWK,AWK是一个行级文本高效处理工具,AWK经过改进生成的新的版本有Nawk、Gawk,一般Linux默认为Gawk,Gawk是 AWK的GNU开源免费版本。
AWK基本原理是逐行处理文件中的数据,查找与命令行中所给定内容相匹配的模式,如果发现匹配内容,则进行下一个编程步骤,如果找不到匹配内容,则 继续处理下一行。其语法参数格式为,AWK常用参数、变量、函数详解如下:
awk ‘pattern + {action}’ file |
---|
常用AWK工具企业演练案列:
df -h|awk ‘{print $1}’ |
---|
awk -F ‘[ :\t;]’ ‘{print $1}’ jfedu.txt |
---|
awk -F: ‘{print $1 >>”/tmp/awk.log”}’ jfedu.txt |
---|
awk ‘NR==3,NR==5 {print}’ jfedu.txtawk ‘NR==3,NR==5 {print $0}’ jfedu.txt |
---|
awk ‘length($0)>80 {print NR}’ jfedu.txt |
---|
awk -v STR=hello ‘{print STR,$NF}’ jfedu.txtSTR=”hello”;echo| awk ‘{print “‘${STR}'”;}’ |
---|
netstat -an | awk ‘/tcp/ {s[$NF]++} END {for(a in s) {print a,s[a]}}’netstat -an | awk ‘/tcp/ {print $NF}’ | sort | uniq -c |
---|
04Shell编程四剑客之GREP
全面搜索正则表达式(Global search regular expression(RE) ,GREP)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。
Unix/Linux的grep家族包括grep、egrep和fgrep,其中egrep和fgrep的命令跟grep有细微的区别,egrep是grep的扩展,支持更多的re元字符, fgrep是fixed grep或fast grep简写,它们把所有的字母都看作单词,正则表达式中的元字符表示其自身的字面意义,不再有其他特殊的含义,一般使用比较少。
目前Linux操作系统默认使用GNU版本的grep。它功能更强,可以通过-G、-E、-F命令行选项来使用egrep和fgrep的功能。其语法格式及常用参数详解如下:
grep -[acinv] ‘word’ Filename |
---|
Grep常用参数详解如下:
-a 以文本文件方式搜索;-c 计算找到的符合行的次数;-i 忽略大小写;-n 顺便输出行号; |
---|
学习Grep时,需要了解通配符、正则表达式两个概念,很多读者容易把彼此搞混淆,通配符主要用在Linux的Shell命令中,常用于文件或者文件名称的操作,而正则表达式用于文本内容中的字符串搜索和替换,常用在AWK、GREP、SED、VIM工具中对文本的操作。
通配符类型详解:
* 0个或者多个字符、数字;? 匹配任意一个字符;# 表示注解;| 管道符号;;多个命令连续执行; |
---|
正则表达式详解:
* 前一个字符匹配0次或多次;. 匹配除了换行符以外任意一个字符;.* 代表任意字符;^ 匹配行首,即以某个字符开头;$ 匹配行尾,即以某个字符结尾;\(..\) 标记匹配字符;[] 匹配中括号里的任意指定字符,但只匹配一个字符;[^] 匹配除中括号以外的任意一个字符; |
---|
常用GREP工具企业演练案列:
grep -c “test” jfedu.txt 统计test字符总行数;grep -i “TEST” jfedu.txt 不区分大小写查找TEST所有的行;grep -n “test” jfedu.txt 打印test的行及行号;grep -v “test” jfedu.txt 不打印test的行;grep “test[53]” jfedu.txt 以字符test开头,接5或者3的行;grep “^[^test]” jfedu.txt 显示输出行首不是test的行;grep “[Mm]ay” jfedu.txt 匹配M或m开头的行;grep “K…D” jfedu.txt 匹配K,三个任意字符,紧接D的行; |
---|