Non greedy正则表达式匹配怎么弄?

内容来源于 Stack Overflow,并遵循CC BY-SA 3.0许可协议进行翻译与使用

  • 回答 (10)
  • 关注 (0)
  • 查看 (118)

我图使用sed来清理URL行

因此:

http://www.suepearson.co.uk/product/174/71/3816/

我要:

http://www.suePearson.co.uk/

我试过:

 sed 's|\(http:\/\/.*?\/\).*|\1|'

sed 's|\(http:\/\/.*\?\/\).*|\1|'

但是我似乎不能让Non greedy的量词工作,所以它总是匹配整个字符串。

提问于
用户回答回答于

模拟sed 中的 lazy (un-greedy)量词。

还有其他的regex口味!

  1. 找到表达式的第一次出现:
    • POSIX e(使用-r(备选方案)

Regex:

(EXPRESSION).*.

SED:

SED-r“s/(EXPRESSION)*./\1/g“#Globalg修饰符应该打开

示例:

$ sed -r "s/([0-9]+).*|./\1/g" <<< "foo 12 bar 34"

其工作原理如何呢??

这个正则表达式从交替中受益。|在每一个位置,引擎都会寻找第一面的交替(我们的目标),如果它不匹配,第二面的交替,其中有一个点。.匹配下一个即时字符。

由于设置了全局标志,引擎将继续逐字符匹配,直到输入字符串或目标结束为止。一旦第一次也是唯一一次捕获左侧交替组的匹配(EXPRESSION)其余部分也会立即消耗.*我们现在在第一个捕获组中保留我们的值。

POSIX BRE

Regex:

\(\(\(EXPRESSION\).*\)*.\)*

Sed:

sed "s/\(\(\(EXPRESSION\).*\)*.\)*/\3/"

Example (finding first sequence of digits):

$ sed "s/\(\(\([0-9]\{1,\}\).*\)*.\)*/\3/" <<< "foo 12 bar 34"

这个版本类似于Ere版本,但没有任何修改。仅此而已。在每个位置,引擎都试图匹配一个数字

foo 12 bar 34

如果找到了,其他的数字将被消耗和捕获,其余的行将立即匹配,因为*手段多或零它跳过第二个捕获组。\(\([0-9]\{1,\}\).*\)*到达一个点.若要匹配单个字符,则此过程将继续。二次第一次发现定界表达:

此方法将与第一次出现的字符串进行匹配,该字符串是分隔的。我们可以称它为字符串块。

sed "s/\(END-DELIMITER-EXPRESSION\).*/\1/; \ s/\(\(START-DELIMITER-EXPRESSION.*\)*.\)*/\1/g"

输入字符串:

foobar start block #1 end barfoo start block #2 end

-EDE:end

-SDE:start

$ sed "s/\(end\).*/\1/; s/\(\(start.*\)*.\)*/\1/g"

输出:

start block #1 end

第一判据\(end\).*匹配和捕获第一个结束分隔符end并替换所有替换与最近捕获的字符,这是结束分隔符。在现阶段,我们的产出是:foobar start block #1 end...

然后将结果传递给第二正则表达式。\(\(start.*\)*.\)*这与上述POSIX BRE版本相同。如果开始分隔符,则匹配单个字符。start不匹配,否则它将匹配和捕获开始分隔符,并匹配其余字符。

直接回答你的问题

使用方法2(分隔表达式),你应该选择两个适当的表达式:

  • Ede:[^:/]\/
  • SDE:http:

用法:

$ sed "s/\([^:/]\/\).*/\1/g; s/\(\(http:.*\)*.\)*/\1/" <<< "http://www.suepearson.co.uk/product/174/71/3816/"

输出:

http://www.suepearson.co.uk/

热门问答

对象存储COS有没有日志功能?

Hyman Wang

腾讯云 · 高级产品经理 (已认证)

推荐已采纳

你的cos 是否开通了 CDN 加速,如果开通了CDN 加速,可以去 CDN 的控制台下: (统计分析 --- 监控 )页面下拉到底部,可以通过 URL 查看流量情况。

对象存储里的视频能在线播放么?

Jinqn

腾讯 · 高级工程师 (已认证)

腾讯云COS前端开发
推荐

购买的云数据库里面有什么类型的数据库?有SQLserver吗?可以自己安装SQLserver吗?

帅的惊动我国计算机大神
推荐已采纳
云关系型数据库让您在云中轻松部署、管理和扩展的关系型数据库,提供安全可靠、伸缩灵活的按需云数据库服务。腾讯云关系型数据库提供 MySQL、SQL Server、MariaDB、PostgreSQL 数据库引擎,并针对数据库引擎的性能进行了优化。云关系型数据库是一种高度可用的托管服...... 展开详请

linux如何限制单一ip对服务器的日访问量?

小爱同学

腾讯云 · 技术支持 (已认证)

推荐
您根据当前网站规模和业务了解下【网站管家 WAF】,企业站点可有效抵御恶意攻击,垃圾访问。 图片.png 您反馈网站短信验证码被盗刷,也可结合自己业务,可自行部署iptables进行手动拦截。或其他方式 例如您的网站是nginx,在web配置文件中开启配置HttpLimitR...... 展开详请

兼容性测试只能上传apk测试的吗?

WeTest质量开放平台团队专注游戏,提升品质
推荐

目前不支持公众号的兼容测试,还请知晓

关于群自动解散的问题?

安稳

腾讯科技 · 工单技术支持 (已认证)

推荐
您好,临时群是没有的。云通信的群组只有私有群(Private)、公开群(Public)、聊天室(ChatRoom)、音视频聊天室(AVChatRoom)和在线成员广播大群(BChatRoom)这五种。 您说的这个需求,思路:创建群组时,服务端记录一下时间,到达约定解散的时间以后,...... 展开详请

所属标签

扫码关注云+社区