专栏首页北京马哥教育grep、egrep正则表达式之初窥门径

grep、egrep正则表达式之初窥门径

何谓正则表达式

正则表达式,又称正规表示法、常规表示法 (Regular Expression,在代码中常简写为regex、regexp或RE),是一类字符所书写的模式,其中许多字符不表示其字面意义,而是表达控制或通配 等功能。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的 文本。许多程序设计语言都支持利用正则表达式进行字符串操作。

正则表达式语言由两种基本字符类型组成:原义(正常)文本字符和元字符。元字符使正则表达式具有处理能力。所谓元字符就是指那些在正则表达式中具有特殊意义的专用字符,不表示其字面意义,而用于额外功能性描述。

正则表达式分类

正则表达式根据元字符的数量及功能不同又分为基本 正则表达式(grep)和拓展正则表达式(egrep)。而grep和egrep同属于文本搜索工具,可根据用户指定的文本模式(搜索条件)对目标文件进 行逐行搜索,显示能匹配到的行。用法上grep –E等同于egrep,与grep和egrep相似的文本搜索工具还有fgrep,因不支持使用正则表达式,所以不再单独介绍。

基本正则表达式(grep)

语法格式:grep[option]… ‘PATTERN’ FILE…

基本正则表达式元字符:

1.字符匹配:

 .:任意单个字符[ ]:匹配指定范围内的任意单个字符[0-9]:匹配单个数字[a-z]:匹配单个小写字母[A-Z]:匹配单个大写字母[[:digit:]]:匹配单个数字[[:lower:]]:匹配单个小写字母[[:upper:]]:匹配单个大写字母[[:space:]]:匹配单个空白字符[[:punct:]]:匹配单个标点符号[[:alnum:]]:匹配单个字母或数字[[:alpha:]]:匹配单个字母(不分大小写)[^]:匹配范围外的任意单个字符

2.次数匹配

*:任意次(前面字符出现任意次)\?:0次或1次(前面字符可有可无)\{m\}: m次(前面字符出现m次)\{m,n\}:至少m次,至多n次\{m,\}:至少m次\{0,n\}:至多n次.*:任意长度的任意字符

3.位置锚定:

^:行首锚定(写在模式最左侧)$:行尾锚定(写在模式最右侧)^$:空白行\<,/b:词首锚定(出现于单词左侧)\>,/b:词尾锚定(出现于单词右侧)(注:不包含特殊字符的连续字符组成的串叫单词)

4.分组

 \( \):如\(ab\)*(分组中的模式匹配到的内容,可由正则表达式引擎记忆在内存中,之后可被引用)

5.引用

\n:引用前面的第n个左括号以及与之对应的右括号中的模式所匹配到的内容

拓展正则表达式(egrep)

语法格式:egrep [option] ‘PATTERN’ FILE…

拓展正则表达式元字符:

1.字符匹配:

 .:任意单个字符[ ]:匹配范围内的任意单个字符[^]:匹配范围外的任意单个字符

2.次数匹配:

*:任意次?: 0或1次+:至少1次{m}: m次{m,n}:至少m次,至多n次{m,}:至少m次{0,n}:至多n次

3.位置锚定:

^:行首锚定$:行尾锚定\<,\b:词首锚定\>,\b:词尾锚定^$,^[[:space:]]*$:空白行

4.分组:

( ):分组|:或 

5.引用:

\n:引用前面的第n个左括号以及与之对应的右括号中的模式所匹配到的内容

grep及egrep命令选项

-v: 反向选取
 -o:仅显示匹配的字串,而非字串所在的行-i:ignore-case,忽略字符大小写-A:显示之前两行-B:显示之后两行-C:显示上下两行

牛刀小试

显示/proc/meminfo文件中以大写或小写S开头的行

显示/etc/passwd文件中其默认shell为非/sbin/nologin的用户

显示/etc/passwd文件中其默认shell为/bin/bash的用户中ID号最大的用户

找出/etc/passwd文件中的一位数或两位数

显示/boot/grub/grub.conf中以至少一个空白字符开头的行

显示/etc/rc.d/rc.sysinit文件中,以#开头,后面跟至少一个空白字符,而后又有至少一个非空白字符的行

找出netstat -tan命令执行结果中以’LISTEN’结尾的行

找出当前系统上其用户名和默认shell相同的用户

显示当前系统上root或scholar用户的默认shell

找出/etc/rc.d/init.d/functions文件中某单词后跟一组小括号“()”行

使用echo命令输出一个路径,而后使用grep取出其基名

找出ifconfig命令结果中的1-255之间的数字

The End

好了总结到这里,常用的正则表达式用法就整理的差不多了,以上都是个人学习总结,如有错漏,大

神勿喷~~~

来源链接:http://www.178linux.com/119 网摘文章,如有问题,请联系我们

本文分享自微信公众号 - 马哥Linux运维(magedu-Linux),作者:马帮学员-书生

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2015-10-06

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • grep命令及正则表达式

    grep基本概念 grep:global search regular expression and print out the line. 作用:文本过滤器,...

    小小科
  • 性能调优概述,这是一篇最通俗易懂性能调优的总结!

    硬件配置:CUP Xeon E5620 x 2 8核心, 内存 16G , 硬盘 RAID 10,操作系统: CentOS 6.4 x86_64(64位)。

    小小科
  • 性能调优概述,这是一篇最通俗易懂性能调优的总结!

    精彩早知道 作者概述 什么是性能调优?(what) 为什么需要性能调优?(why) 什么时候需要性能调优?(when) 什么地方需要性能调优?(where) ...

    小小科
  • 案例 | 第一财经周刊:拿表单推广App,就图它省事又有趣

    我是紫薇,嗯,跟大明湖畔和咆哮尔康都没有关系,只是碰巧同名和同姓而已。我在《第一财经周刊》负责新媒体产品的策划推广,逐渐养成了遇到任何活动任何页面都不会放过产品...

    麦客CRM
  • 参数化(一):计划缓存

      简介   很多时候,当我执行查询调优的时候,引发查询性能糟糕的问题一般都是与参数化相关的。一方面,参数化是查询处理器核心的基本主题。它能显著影响查询性能。另...

    用户1217611
  • Android开发之使用SQLite存储数据的方法分析

    本文实例讲述了Android开发之使用SQLite存储数据的方法。分享给大家供大家参考,具体如下:

    砸漏
  • 苹果发布教育版 iPad 的时候,英伟达的黄仁勋扩容了核武器库(没有矿卡)

    先跑题吐槽一下昨晚的苹果发布会,教育版 iPad 的发布几乎没有掀起一丁点波澜,简直愧对其「科技春晚」的名声。反而是「All in 区块链」的朋友们苦追英伟达(...

    HyperAI超神经
  • PHP设计模式——命令行模式

    战斗是为了赢,没有战斗能够在没有一个好的计划或策略来赢得。多数失败的战斗是指挥官在没有任何计划的情况下命令其士兵进入战场的战斗,或者更糟的是,在战斗中没有能力指...

    Lemon黄
  • linux下bin安装mysql的问题

    “mysqld_safe mysqld from pid file /usr/local/mysql/data/localhost.localdomain.pi...

    用户1396155
  • 如何正确的实施ERP?划分计划层次是第一步

    ERP有五个计划层次,即:经营规划、销售与运作规划(生产规划)、主生产计划、物料需求计划、车间作业控制(或生产作业控制)。采购作业也属于第5个层次,但它不涉及企...

    用户5495712

扫码关注云+社区

领取腾讯云代金券