sed命令扩展–转载

文本处理工具之二 sed命令详解

sed:Stream Editor文本流编辑,sed是一个“非交互式的”面向字符流的编辑器。能同时处理多个文件多行的内容,可以不对原文件改动,把整个文件输入到屏幕,可以把只匹配到模式的内容输入到屏幕上。还可以对原文件改动,但是不会再屏幕上返回结果。

sed命令的语法格式:

sed的命令格式: sed [option] ‘sed command’filename

sed命令的选项(option):

-n :只打印模式匹配的行

-e :直接在命令行模式上进行sed动作编辑,此为默认选项

-f :将sed的动作写在一个文件内,用–f filename 执行filename内的sed动作

-r :支持扩展表达式;脱意

-i :直接修改文件内容

2)使用正则表达式、扩展正则表达式(必须结合-r选项)

^

锚点行首的符合条件的内容,用法格式”^pattern”

$

锚点行首的符合条件的内容,用法格式”pattern$”

^$

空白行

.

匹配任意单个字符

*

匹配紧挨在前面的字符任意次(0,1,多次)

.*

匹配任意长度的任意字符

\?

匹配紧挨在前面的字符0次或1次

\{m,n\}

匹配其前面的字符至少m次,至多n次

\{m,\}

匹配其前面的字符至少m次

\{m\}

精确匹配前面的m次\{0,n\}:0到n次

\<

锚点词首—-相当于 \b,用法格式:\

\>

锚点词尾,用法格式:\>pattern

\

单词锚点

\(\)

分组,用法格式:\(pattern\),引用\1,\2

[]

匹配指定范围内的任意单个字符

[^]

匹配指定范围外的任意单个字符

[:digit:]

所有数字, 相当于0-9, [0-9]—> [[:digit:]]

[:lower:]

所有的小写字母

[:upper:]

所有的大写字母

[:alpha:]

所有的字母

[:alnum:]

相当于0-9a-zA-Z

[:space:]

空白字符

[:punct:]

所有标点符号

#######sed的匹配模式支持正则表达式#######

#sed '5 p'  /etc/passwd#打印前5行

#sed -n '/r*t/p'  /etc/passwd       #打印匹配r有0个或者多个,后接一个t字符的行

#sed -n '/.r.*/p'  /etc/passwd      #打印匹配有r的行并且r后面跟任意字符

#sed -n '/o*/p'  /etc/passwd       #打印o字符重复任意次

#sed -n '/o\{1,\}/p'  /etc/passwd      #打印o字重复出现一次以上

#sed -n '/o\{1,3\}/p'  /etc/passwd           #打印o字重复出现一次到三次之间以上

对文件的操作无非就是”增删改查“,怎样用sed命令实现对文件的”增删改查“,玩转sed是写自动化脚本必须的基础之一。

####用sed打印文件的信息的例子的命令(如下解释:)####

#sed -n '/^#/!p'  /etc/vsftpd/vsftpd.conf         

#sed -n '/^#/!{/^$/!p}'   /etc/vsftpd/vsftpd.conf        

#sed -e '/^#/d' -e '/^$/d'   /etc/vsftpd/vsftpd.conf

###以下图片是对这些sed命令例子的解释和显示结果###

sed命令实现对文件内容的添加:(对源文件添加的话就用-i参数):

####sed命令可以实现的添加######

#1)匹配行的行首添加,添加在同行

#2)匹配行的行中的某个字符后添加

#3)匹配行的行尾添加字符

#4)匹配行的行前面行添加

#5)匹配行的行后面行添加

#6)文件的行首添加一行

[[email protected] ~]# sed -i ‘1 i\sed command start’ myfile

#7)文件的行尾追加一行

[[email protected] ~]# sed -i ‘$a \sed command end’ myfile

sed的删除操作是针对文件的行,如果想删除行中的某个字符,那就用替换!

sed的其它高级使用:

1)把正在用sed操作的文件的内容写到例外一个文件中

[[email protected] ~]# cat test

Ethernet

#BOOTPROTO=”dhcp”

HWADDR=”00:0C:29:90:79:78″

ONBOOT=”yes”

IPADDR=172.16.10.12

NETMASK=255.255.0.0

[[email protected] ~]# sed -i ‘s/IPADDR/ip/w ip.txt’ test

#把sed操作的文件内容保存到另外一个文件中,w表示保存,ip.txt文件名

[[email protected] ~]# cat ip.txt 

ip=172.16.10.12

2)读取一个文件到正在用sed操作的文件中

[[email protected] ~]# cat myfile 

hello world

i am li

how are you

li

[[email protected] ~]# cat test 

Ethernet

#BOOTPROTO=”dhcp”

HWADDR=”00:0C:29:90:79:78″

ONBOOT=”yes”

IPADDR=172.16.10.12

NETMASK=255.255.0.0

[[email protected] ~]# sed -i ‘/Ethernet/r myfile’ test

#在匹配Ethernet的行,读进来另一个文件的内容,读进来的文件的内容会插入到匹配Ethernet的行后

[[email protected] ~]# cat test

Ethernet

hello world

i am li

how are you

li

#BOOTPROTO=”dhcp”

HWADDR=”00:0C:29:90:79:78″

ONBOOT=”yes”

IPADDR=172.16.10.12

NETMASK=255.255.0.0

sed的经典例子:

##1)、处理以下文件内容,将域名取出并进行计数排序,如处理:

http://www.baidu.com/index.html

http://www.baidu.com/1.html

http://post.baidu.com/index.html

http://mp3.baidu.com/index.html

http://www.baidu.com/3.html

http://post.baidu.com/2.html

得到如下结果:

3 www.baidu.com

2 post.baidu.com

1 mp3.baidu.com

[[email protected] shell]# cat file | sed -e ‘ s/http:\/\///’ -e ‘ s/\/.*//’ | sort | uniq -c | sort -rn

3 www.baidu.com

2 post.baidu.com

1 mp3.baidu.com

也许上面的不是太容易理解,老七整理了一个比较容易理解的给大家参考一下:

[[email protected] sedtest]# cat baidu.txt | sed -r -e ‘s#http://##g’ -e ‘s#/.*##g’ | sort -n |uniq -c 1 mp3.baidu.com 2 post.baidu.com 3 www.baidu.com

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Jackson0714

PHP内核之旅-4.可变长度的字符串

1153
来自专栏C语言C++游戏编程

警告,变量已死亡,C语言基础教程之变量作用域

任何编程中的范围都是程序的一个区域,其中定义的变量可以存在,并且超出该范围,无法访问它。有三个地方可以用C编程语言声明变量

940
来自专栏漫漫前端路

当 Vue 处理数组与处理纯对象的方式一样

当给数组设置 length 时,如果大于数组本身长度,新元素则会以 empty 填充,如下所示:

1232
来自专栏LIN_ZONE

Shell编程基础

请参考:菜鸟教程参数传递 在执行脚本的时候可以向脚本传递参数,脚本获取参数的格式为:$n

682
来自专栏Pythonista

Go语言结构

在我们开始学习 Go 编程语言的基础构建模块前,让我们先来了解 Go 语言最简单程序的结构。

981
来自专栏木子昭的博客

<提升效率>Mysql函数(function)|存储过程(procedure)函数存储过程小结

function_procedure 函数 mysql内置的函数很好用,同样mysql也支持用户自定义函数 1.为避免和函数中的语句结束符;冲突,将语句结束...

4149
来自专栏我的技术专栏

《effective Go》读后记录:GO基础

2244
来自专栏耕耘实录

Linux通配符的使用详解

版权声明:本文为耕耘实录原创文章,各大自媒体平台同步更新。欢迎转载,转载请注明出处,谢谢。

1213
来自专栏Jackson0714

PHP内核之旅-4.可变长度的字符串

3086
来自专栏海天一树

小朋友学C语言(34):main函数的参数

C/C++中的main()函数,可以带形式参数,也可以不带形式参数。这两种形式分别为: 1)int main() 2)int main(int argc, ch...

2866

扫码关注云+社区