Linux三剑客之sed

sed

sed对文本的处理很强大,并且sed非常小,参数少,容易掌握,他的操作方式根awk有点像。sed按顺序逐行读取文件。然后,它执行为该行指定的所有操作,并在完成请求的修改之后的内容显示出来,也可以存放到文件中。完成了一行上的所有操作之后,它读取文件的下一行,然后重复该过程直到它完成该文件。在这里要注意一点,源文件(默认地)保持不被修改。sed 默认读取整个文件并对其中的每一行进行修改。说白了就是一行一行的操作。我用sed主要就是用里面的替换功能,真的很强大。下面以实例,详细的说一下,先从替换开始,最常用的。

参数:

 1 sed -h
 2  -n, --quiet, --silent    取消自动打印模式空间
 3  -e 脚本, --expression=脚本   添加“脚本”到程序的运行列表
 4  -f 脚本文件, --file=脚本文件  添加“脚本文件”到程序的运行列表
 5  --follow-symlinks    直接修改文件时跟随软链接
 6  -i[扩展名], --in-place[=扩展名]    直接修改文件(如果指定扩展名就备份文件)
 7  -l N, --line-length=N   指定“l”命令的换行期望长度
 8  --posix  关闭所有 GNU 扩展
 9  -r, --regexp-extended  在脚本中使用扩展正则表达式
10  -s, --separate  将输入文件视为各个独立的文件而不是一个长的连续输入
11  -u, --unbuffered  从输入文件读取最少的数据,更频繁的刷新输出
12  --help     打印帮助并退出
13  --version  输出版本信息并退出

实例练习:

测试文件如:

 1 root:x:0:0:root:/root:/bin/bash
 2 bin:x:1:1:bin:/bin:/bin/false
 3 daemon:x:2:2:daemon:/sbin:/bin/false
 4 mail:x:8:12:mail:/var/spool/mail:/bin/false
 5 ftp:x:14:11:ftp:/home/ftp:/bin/false
 6 &nobody:$:99:99:nobody:/:/bin/false
 7 zhangy:x:1000:100:,,,:/home/zhangy:/bin/bash
 8 http:x:33:33::/srv/http:/bin/false
 9 dbus:x:81:81:System message bus:/:/bin/false
10 hal:x:82:82:HAL daemon:/:/bin/false
11 mysql:x:89:89::/var/lib/mysql:/bin/false
12 aaa:x:1001:1001::/home/aaa:/bin/bash
13 ba:x:1002:1002::/home/zhangy:/bin/bash
14 test:x:1003:1003::/home/test:/bin/bash
15 @zhangying:*:1004:1004::/home/test:/bin/bash
16 policykit:x:102:1005:Po

一:把test文件中的root替换成tankzhang

1 # sed 's/root/tankzhang/' test

二:用tankzhang把文件test中的root全部替换掉,请注意g这个字母

1 # sed 's/root/tankzhang/g' test |grep zhang
2  tankzhang:x:0:0:tankzhang:/tankzhang:/bin/bash
3  zhangy:x:1000:100:,,,:/home/zhangy:/bin/bash
4  ba:x:1002:1002::/home/zhangy:/bin/bash
5  @zhangying:*:1004:1004::/home/test:/bin/bash

三:加了-n p后表示只打印那些发生替换的行(部分替换),上面的例子,我并没有加上grep

1 # sed -n 's/root/tankzhang/p' test
2  tankzhang:x:0:0:root:/root:/bin/bash

四:,在第二行,到第八行之间,替换以zhang开头的行,用ying来替换,并显示替换的行

1 # cat test | sed -ne '2,8s/^zhang/ying/gp'
2  yingy:x:1000:100:,,,:/home/zhangy:/bin/bash

五:当有多个命令要执行时,可以用分号来分开,并且分隔符可以自定义,默认是/。上面的例子意思是在第二行,到第八行之间,替换以zhang开头的行,用ying来替换,在5,到10间,用goodbay来替换dbus,并显示替换的行

1 # cat test | sed -n  '2,8s/^zhang/ying/gp;5,10s#dbus#goodbay#gp'
2  yingy:x:1000:100:,,,:/home/zhangy:/bin/bash
3  goodbay:x:81:81:System message bus:/:/bin/false

六:,行替换,用匹配root的行,来替换匹配zhangy的行

 1 $ sed -e '/root/h' -e '/zhangy/g' test
 2  root:x:0:0:root:/root:/bin/bash
 3  bin:x:1:1:bin:/bin:/bin/false
 4  daemon:x:2:2:daemon:/sbin:/bin/false
 5  mail:x:8:12:mail:/var/spool/mail:/bin/false
 6  ftp:x:14:11:ftp:/home/ftp:/bin/false
 7  &nobody:$:99:99:nobody:/:/bin/false
 8  root:x:0:0:root:/root:/bin/bash
 9  http:x:33:33::/srv/http:/bin/false
10  dbus:x:81:81:System message bus:/:/bin/false
11  hal:x:82:82:HAL daemon:/:/bin/false
12  mysql:x:89:89::/var/lib/mysql:/bin/false
13  aaa:x:1001:1001::/home/aaa:/bin/bash
14  root:x:0:0:root:/root:/bin/bash
15  test:x:1003:1003::/home/test:/bin/bash
16  root:x:0:0:root:/root:/bin/bash

注意:特殊匹配

 1 匹配数字别忘了中括号外面还有一个中括号。
 2 [:alnum:] 字母数字 [a-z A-Z 0-9]
 3 [:alpha:] 字母 [a-z A-Z]
 4 [:blank:] 空格或制表键
 5 [:cntrl:] 任何控制字符
 6 [:digit:] 数字 [0-9]
 7 [:graph:] 任何可视字符(无空格)
 8 [:lower:] 小写 [a-z]
 9 [:print:] 非控制字符
10 [:punct:] 标点字符
11 [:space:] 空格
12 [:upper:] 大写 [A-Z]
13 [:xdigit:] 十六进制数字 [0-9 a-f A-F]

例a,删除1,14行

1 $ sed -e '1,14d' test
2  @zhangying:*:1004:1004::/home/test:/bin/bash
3  policykit:x:102:1005:Po

例b,删除4以后的行,包括第4行,把$当成最大行数就行了。

1 $ sed -e '4,$d' test
2  root:x:0:0:root:/root:/bin/bash
3  bin:x:1:1:bin:/bin:/bin/false
4  daemon:x:2:2:daemon:/sbin:/bin/false

例c,删除包括false的行,或者包括bash的行,别忘了加\

1 $ sed -e '/\(false\|bash\)$/d' test
2  policykit:x:102:1005:Po

例d,删除从匹配root的行,到匹配以test开头的行,中间的行

1 $ sed -e '/root/,/^test/d' test
2  @zhangying:*:1004:1004::/home/test:/bin/bash
3  policykit:x:102:1005:Po

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏nummy

在Flask中使用ajax的POST方法传递数组

如果在服务器端使用flask中的request.form.get方法是无法获取到数据的,因为我们传递的是数组,而不是单个元素。 怎么办? flask还提供了...

701
来自专栏代码世界

Django之路由系统

Django的路由系统   URL配置其实就是告诉Django项目你执行代码的路径,本质就是路径和调用的视图函数之间的映射关系表。Django通过这个表,可以把...

2717
来自专栏GreenLeaves

JavaScript之JS的执行环境和作用域

 一、执行环境是JavaScript中最为重要的一个概念。执行环境定义了变量或函数有权访问的其他数据,决定了他们各自的行为,每个执行环境都有一个与之关联的变量对...

1585
来自专栏coder修行路

Nginx location 匹配顺序整理

Nginx location模块整理 具体的Nginx安装就不在这里描述了,这里只是为了对location的描述 Nginx环境 a. 查看当前系统cat /e...

2477
来自专栏Python绿色通道

Python进阶三部曲之IO操作

写在前面:前几天准备做数据分析,发现没有数据来源,于是我不得不准备爬虫方面的教程了。

702
来自专栏从零开始学自动化测试

python笔记20-获取当前运行函数名

写完代码之后,一般为了方便查看日志,可以在日志输出中加入当前运行的函数名称或类和方法名称,以便于代码报错的时候能快速找到报错的是哪个函数或方法。 那么如何获取当...

771
来自专栏转载gongluck的CSDN博客

学习GDB

1 简介      GDB(GNU Debugger)是GCC的调试工具。其功能强大,现描述如下:      GDB主要帮忙你完成下面四个方面的功能:     ...

3467
来自专栏Python小屋

一行Python代码统计词频

问题描述:给定一段文本,统计其中每个单词的出现频率。 技术要点:扩展库jieba的cut()函数,标准库collections中的Counter类。 参考代码:...

2913
来自专栏程序员互动联盟

android apk 防止反编译技术第二篇-运行时修改字节码

上一篇我们讲了apk防止反编译技术中的加壳技术,如果有不明白的可以查看我的上一篇博客http://my.oschina.net/u/2323218/blog/3...

34811
来自专栏Python爬虫实战

Python指南:文件处理

哪种文件格式最适合用于存储整个数据集——二进制、文本还是XML?这严重依赖于具体的上下文。

921

扫码关注云+社区