扩展正则表达式及应用

第1章 扩展正则表达式

1.1  + 前一个字符连续出现了1次或1次以上

egrep  "0+" oldboy.txt  1次或1次以上 >=1

egrep  "0*" oldboy.txt  0次或0次以上 >=0

1.1.1 找到文本中的0

[root@znix ~]# egrep  "0+" oldboy.txt

my qq num is 49000448.

not 4900000448.

[root@znix ~]# egrep -o  "0+" oldboy.txt

000

00000

1.1.2 取出文件中的大写字母

[root@znix ~]# grep -o "[A-Z]" oldboy.txt

I

I

I

O

L

D

B

O

Y

1.1.3 取出连续出现的大写字母

[root@znix ~]# egrep -o "[A-Z]+" oldboy.txt

I

I

I

OLDBOY

1.1.4 显示所有的单词

[root@znix ~]# egrep -o "[A-Za-z]+" oldboy.txt

I

am

oldboy

teacher

1.2  | 或者

表示找其中的一个或者是另外一个。

[root@znix ~]# egrep "oldboy|oldbey" oldboy.txt  -o

oldboy

oldboy

oldbey

找/etc/services 中的两个端口

[root@znix ~]# egrep "3306|1521" /etc/services

mysql           3306/tcp                        # MySQL

mysql           3306/udp                        # MySQL

ncube-lm        1521/tcp                # nCube License Manager

ncube-lm        1521/udp                # nCube License Manager

找其中的A或者B或者C。

[root@znix ~]# egrep "A|B|C" oldboy.txt

my god ,i am not oldbey,but OLDBOY!

找到12或者56替换成空。

[root@znix ~]# echo 123456|sed -r 's#12|56##g'

34

1.3 () 小括号 反向引用

小括号里面的内容是一个整体,相当于是一个字符

1.3.1 表示一个整体

[root@znix ~]# egrep "oldb(o|e)y" oldboy.txt

I am oldboy teacher!

my blog is http://oldboy.blog.51cto.com

my god ,i am not oldbey,but OLDBOY!

1.3.2 反向引用

       sed -r 使用扩展正则

[root@znix ~]# echo 123456|sed -r 's#..(..)..#\1#g'

34

点表示任意一个字符,\2表示第二个括号。

[root@znix ~]# echo 123456|sed -r 's#(.).(..).(.)#\2#g'

34

1.4 {} 大括号(花括号)

0{n,m} 数字0连续出现了至少n次,最多m次

[root@znix ~]# egrep "[a-z]{3,6}" oldboy.txt

I am oldboy teacher! I teach linux. I like badminton ball ,billiard ball and chinese chess! my blog is http://oldboy.blog.51cto.com our site is http://www.etiantian.org my qq num is 49000448. not 4900000448. my god ,i am not oldbey,but OLDBOY!

[root@znix ~]# egrep "[a-zA-Z]{3,6}" oldboy.txt

I am oldboy teacher! I teach linux. I like badminton ball ,billiard ball and chinese chess! my blog is http://oldboy.blog.51cto.com our site is http://www.etiantian.org my qq num is 49000448. not 4900000448. my god ,i am not oldbey,but OLDBOY! [root@znix ~]#

1.4.1 大括号的不同方法

 0{3,6}   >=3 <=6

 0{3}     ==3

 0{3,}    >=3

 0{,6}    >=0 <=6

1.5  ?

前一个字符连续出现了 0次或1次

1.5.1 环境

[root@znix ~]# cat a.log

good

gd

god

goood

1.5.2 o连续出现0次或1次

[root@znix ~]# egrep "gd|god" a.log

gd god

[root@znix ~]# egrep "go?d" a.log

gd god

1.6 正则表达式分类

1.6.1 基础正则

^       以……开头

$       以……结尾

^$     空行

.*      所有

[abc]   表示abc

[a-z]   表示a到z

[A-Z]   表示A-Z

[^abc]  表示排除abc

1.6.2 扩展正则表达式

+      连续出现 1次或1次以上

|       或者

()      小括号里面的内容是一个整体,相当于是一个字符

{}      0{n,m} 数字0连续出现了至少n次,最多m次

?       前一个字符连续出现了 0次或1次

第2章 取出eth0网卡的ip地址

2.1 思路

1)先定位 取出第二行

2)取出ip地址

2.1.1 看eth0的内容

[root@znix ~]# ifconfig eth0

eth0      Link encap:Ethernet  HWaddr 00:0C:29:A8:E4:14 

          inet addr:10.0.0.201  Bcast:10.0.0.255  Mask:255.255.255.0

          inet6 addr: fe80::20c:29ff:fea8:e414/64 Scope:Link

          UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1

          RX packets:86884 errors:0 dropped:0 overruns:0 frame:0

          TX packets:74978 errors:0 dropped:0 overruns:0 carrier:0

          collisions:0 txqueuelen:1000

          RX bytes:14324203 (13.6 MiB)  TX bytes:26220378 (25.0 MiB)

2.2 方法一 sed 去头去尾

用sed命令,将其中不需要显示的,逐步替换。

[root@znix ~]#  ifconfig eth0|sed -n '2p'|sed 's#^.*dr:##g'|sed 's# .*$##g'

10.0.0.201

2.3 方法二sed 反向引用

反向替换,使用()把ip地址保护起来,\1方向选择,显示出来ip。

[root@znix ~]# ifconfig eth0|sed -nr '2s#^.*dr:(.*)  Bc.*$#\1#gp'

10.0.0.201

简写?

[root@znix ~]# ifconfig eth0|sed -n '2p'|sed -r 's#^.*dr:(.*)Bc.*$#\1#g'

10.0.0.201 

2.4 方法三

使用把[^0-9.]之外的替换成空格,使用awk取出第一列。

[root@znix ~]# ifconfig eth0|sed -n '2s#[^0-9.]# #gp'|awk '{print $1}'

10.0.0.201

2.5 方法四

awk 指定分隔符,将空格和分号都定为分隔符,然后取列。

[root@znix ~]# ifconfig eth0|sed -n '2p'|awk -F "[ :]+" '{print $4}'

10.0.0.201

第3章 第三关练习题

3.1 如何取得/etiantian文件的权限对应的数字内容,如-rw-r--r--为644,要求使用命令取得644 这样的数字。

3.1.1 方法一 反向引用

使用反向引用,保护要取出的内容。

[root@znix ~]# stat /etc/services |sed -nr '4s#^.*\(0(.*)/-.*$#\1#gp'

644

3.1.2 方法二 掐头去尾

两个sed 将不需要的东西替换为空。

[root@znix ~]# stat /etc/hosts |sed -n '4s#^.*(0##gp'|sed 's#/.*$##g'

644

3.1.3 方法三 排除

[^0-7] 除了0到7以外的替换成空格

[root@znix ~]#  stat /etc/hosts |sed -n '4s#[^0-7]##gp'

064400

[root@znix ~]# stat /etc/hosts|sed -nr '4s#[^0-7]+# #gp'

 0644 0 0

第4章 特殊符号、通配符

4.1 特殊符号

&&   并且 前面的执行对了执行后面

||   或者 前面命令执行失败了再执行后面的

>>   追加输出重定向

>   标准输出重定向

/    根 路径的分隔符

$    取变量的内容

.    当前目录

..   当前目录的上一级目录

~    家目录

|    管道

!    取反 find awk

#    注释

4.2 通配符

* {}    找出文件

4.3 正则表达式(三剑客grep sed awk使用)

^

$

^$

.*

[abc]   一个整体 a或b或c

正则表达式认为只要是在中括号里面的就是一样的.

[^abc]  出a或b或c之外

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏mwangblog

python模块

1093
来自专栏前端架构

javascript在html页面中的加载与执行顺序

通常来说,浏览器对于Javascript的运行有两大特性:1)载入后马上执行,2)执行时会阻塞页面后续的内容(包括页面的渲染、其它资源的下载)。于是,如果有多个...

752
来自专栏C/C++基础

Linux命令(1)——xargs命令

xargs可以将stdin中以空格或换行符进行分隔的数据,形成以空格分隔的参数(arguments),传递给其他命令。因为以空格作为分隔符,所以有一些文件名或者...

813
来自专栏小詹同学

Python 中的 sys.argv 是个什么鬼?

最近在 github 上 git 别人的代码下来学习 ,其中有一个 face-detection 相关的代码 ,就涉及了 sys.argv ,并且运行后是这个样...

823
来自专栏HTML5学堂

return语句的用法

HTML5学堂:在函数当中,存在着return语句,今天我们就主要讲解一下return在函数中的作用,也来提一提return的默认值是多少,还有就是return...

3405
来自专栏gaoqin31

jQuery源码浅析

如果说php是世界上最好的语言,那么javascript无疑可以称为世界上最飘逸的语言,最近看了下jQuery的源码,实现了一个简陋的jQuery。我觉得要看懂...

1153
来自专栏web前端

select 遇到的坑

一、select遇到的坑      1、select赋默认值--多选和单选           1.1     单选:$('#id').val( value )...

21710
来自专栏Java成神之路

Mybatis异常_02_Result Maps collection already contains value for

   XXXMapper.xml文件中存在重名对象,保持名称不要一样即可正常启动。

903
来自专栏技术博文

Linux里如何查找文件内容

Linux查找文件内容的常用命令方法。   从文件内容查找匹配指定字符串的行: $ grep "被查找的字符串" 文件名 例子:在当前目录里第一级文件夹中寻找包...

4054
来自专栏软件开发 -- 分享 互助 成长

case语句居然还可以这么用的

直接上代码了 // switch case case语句测试.cpp : 定义控制台应用程序的入口点。 // #include "stdafx.h" #inc...

17510

扫码关注云+社区