Non greedy正则表达式匹配怎么弄?

内容来源于 Stack Overflow,并遵循CC BY-SA 3.0许可协议进行翻译与使用

  • 回答 (10)
  • 关注 (0)
  • 查看 (53)

我图使用sed来清理URL行

因此:

http://www.suepearson.co.uk/product/174/71/3816/

我要:

http://www.suePearson.co.uk/

我试过:

 sed 's|\(http:\/\/.*?\/\).*|\1|'

sed 's|\(http:\/\/.*\?\/\).*|\1|'

但是我似乎不能让Non greedy的量词工作,所以它总是匹配整个字符串。

提问于
用户回答回答于

模拟sed 中的 lazy (un-greedy)量词。

还有其他的regex口味!

  1. 找到表达式的第一次出现:
    • POSIX e(使用-r(备选方案)

Regex:

(EXPRESSION).*.

SED:

SED-r“s/(EXPRESSION)*./\1/g“#Globalg修饰符应该打开

示例:

$ sed -r "s/([0-9]+).*|./\1/g" <<< "foo 12 bar 34"

其工作原理如何呢??

这个正则表达式从交替中受益。|在每一个位置,引擎都会寻找第一面的交替(我们的目标),如果它不匹配,第二面的交替,其中有一个点。.匹配下一个即时字符。

由于设置了全局标志,引擎将继续逐字符匹配,直到输入字符串或目标结束为止。一旦第一次也是唯一一次捕获左侧交替组的匹配(EXPRESSION)其余部分也会立即消耗.*我们现在在第一个捕获组中保留我们的值。

POSIX BRE

Regex:

\(\(\(EXPRESSION\).*\)*.\)*

Sed:

sed "s/\(\(\(EXPRESSION\).*\)*.\)*/\3/"

Example (finding first sequence of digits):

$ sed "s/\(\(\([0-9]\{1,\}\).*\)*.\)*/\3/" <<< "foo 12 bar 34"

这个版本类似于Ere版本,但没有任何修改。仅此而已。在每个位置,引擎都试图匹配一个数字

foo 12 bar 34

如果找到了,其他的数字将被消耗和捕获,其余的行将立即匹配,因为*手段多或零它跳过第二个捕获组。\(\([0-9]\{1,\}\).*\)*到达一个点.若要匹配单个字符,则此过程将继续。二次第一次发现定界表达:

此方法将与第一次出现的字符串进行匹配,该字符串是分隔的。我们可以称它为字符串块。

sed "s/\(END-DELIMITER-EXPRESSION\).*/\1/; \ s/\(\(START-DELIMITER-EXPRESSION.*\)*.\)*/\1/g"

输入字符串:

foobar start block #1 end barfoo start block #2 end

-EDE:end

-SDE:start

$ sed "s/\(end\).*/\1/; s/\(\(start.*\)*.\)*/\1/g"

输出:

start block #1 end

第一判据\(end\).*匹配和捕获第一个结束分隔符end并替换所有替换与最近捕获的字符,这是结束分隔符。在现阶段,我们的产出是:foobar start block #1 end...

然后将结果传递给第二正则表达式。\(\(start.*\)*.\)*这与上述POSIX BRE版本相同。如果开始分隔符,则匹配单个字符。start不匹配,否则它将匹配和捕获开始分隔符,并匹配其余字符。

直接回答你的问题

使用方法2(分隔表达式),你应该选择两个适当的表达式:

  • Ede:[^:/]\/
  • SDE:http:

用法:

$ sed "s/\([^:/]\/\).*/\1/g; s/\(\(http:.*\)*.\)*/\1/" <<< "http://www.suepearson.co.uk/product/174/71/3816/"

输出:

http://www.suepearson.co.uk/

热门问答

腾讯云 COS 怎么才能外链调用 m3u8 到别的网站播放?

滑稽园扛把子

Swoole · PHP开发工程师 (已认证)

As a PHP Developer
推荐
设置公有读私有写:当访问对象时,COS 读取到对象的权限为公有读,此时无论存储桶为何种权限,对象都可以被直接下载 设置步骤 登录 对象存储控制台,选择左侧菜单栏【存储桶列表】,进入存储桶列表页面。单击需要修改对象权限的对应存储桶,进入存储桶。 📷 找到需要设置权限的对象(如 e...... 展开详请

Ubuntu搭建的WordPress如何修改php.ini?

滑稽园扛把子

Swoole · PHP开发工程师 (已认证)

As a PHP Developer
推荐
php新手很多不知道怎么查配置文件在哪,这里提供一个很简单的方法 使用 php -i 命令可以打印php的详细信息,可以把这堆东西输出一下 php -i > outputphp.txt,结合 grep 查找命令 php -i| grep php.ini 打印结果如下 Config...... 展开详请

归档存储采用的存储介质是什么, 安全可靠吗?

滑稽园扛把子

Swoole · PHP开发工程师 (已认证)

As a PHP Developer
推荐
归档存储主要是针对海量、重要且访问频率极低的非结构化数据进行长期的归档保存和备份管理。 在数据安全层面,归档存储提供数据锁定机制,防止数据被修改和删除,保障数据安全。 技术架构: image.png 与对象存储的差异 归档存储 CAS 是一项离线存储服务,不同于在线的对象存储 ...... 展开详请

在按官网手册排错后依然提示1004错误?

看你的代码好像是短信相关的代码,1004错误代表请求包解析失败,通常情况下是由于没有遵守 API 接口说明规范导致的。 建议您通过以下方式定位解决: 首先,要确认发送的请求是否是标准的 json 格式; 第二,检查是否有将单引号当做双引号使用(json 标准应该是双引号); 第...... 展开详请

redis数据库应该怎样连接???

滑稽园扛把子

Swoole · PHP开发工程师 (已认证)

As a PHP Developer
推荐
实例初始化完成后,连接腾讯云Redis时,需要输入设置的密码。主从版和集群版的连接示例如下 主从版连接示例 主从版支持2种格式 • 格式1,“实例id:密码”的格式类型,例如您的实例id是crs-bkuza6i3,设置的密码是abcd1234,则连接命令如下 redis-cli ...... 展开详请

如何使用holer实现从外网访问本地WEB应用?

Dingda

Dingda · 站长 (已认证)

多一些不为什么的坚持
推荐
解压holer软件 获取holer access key信息: 在holer官网上申请专属的holer access key或者使用开源社区上公开的access key信息。 启动holer服务: Windows系统平台: 打开CMD窗口进入可执行程序所在的目录下,执行命令:...... 展开详请

所属标签

扫码关注云+社区