Non greedy正则表达式匹配怎么弄?

内容来源于 Stack Overflow,并遵循CC BY-SA 3.0许可协议进行翻译与使用

  • 回答 (10)
  • 关注 (0)
  • 查看 (65)

我图使用sed来清理URL行

因此:

http://www.suepearson.co.uk/product/174/71/3816/

我要:

http://www.suePearson.co.uk/

我试过:

 sed 's|\(http:\/\/.*?\/\).*|\1|'

sed 's|\(http:\/\/.*\?\/\).*|\1|'

但是我似乎不能让Non greedy的量词工作,所以它总是匹配整个字符串。

提问于
用户回答回答于

模拟sed 中的 lazy (un-greedy)量词。

还有其他的regex口味!

  1. 找到表达式的第一次出现:
    • POSIX e(使用-r(备选方案)

Regex:

(EXPRESSION).*.

SED:

SED-r“s/(EXPRESSION)*./\1/g“#Globalg修饰符应该打开

示例:

$ sed -r "s/([0-9]+).*|./\1/g" <<< "foo 12 bar 34"

其工作原理如何呢??

这个正则表达式从交替中受益。|在每一个位置,引擎都会寻找第一面的交替(我们的目标),如果它不匹配,第二面的交替,其中有一个点。.匹配下一个即时字符。

由于设置了全局标志,引擎将继续逐字符匹配,直到输入字符串或目标结束为止。一旦第一次也是唯一一次捕获左侧交替组的匹配(EXPRESSION)其余部分也会立即消耗.*我们现在在第一个捕获组中保留我们的值。

POSIX BRE

Regex:

\(\(\(EXPRESSION\).*\)*.\)*

Sed:

sed "s/\(\(\(EXPRESSION\).*\)*.\)*/\3/"

Example (finding first sequence of digits):

$ sed "s/\(\(\([0-9]\{1,\}\).*\)*.\)*/\3/" <<< "foo 12 bar 34"

这个版本类似于Ere版本,但没有任何修改。仅此而已。在每个位置,引擎都试图匹配一个数字

foo 12 bar 34

如果找到了,其他的数字将被消耗和捕获,其余的行将立即匹配,因为*手段多或零它跳过第二个捕获组。\(\([0-9]\{1,\}\).*\)*到达一个点.若要匹配单个字符,则此过程将继续。二次第一次发现定界表达:

此方法将与第一次出现的字符串进行匹配,该字符串是分隔的。我们可以称它为字符串块。

sed "s/\(END-DELIMITER-EXPRESSION\).*/\1/; \ s/\(\(START-DELIMITER-EXPRESSION.*\)*.\)*/\1/g"

输入字符串:

foobar start block #1 end barfoo start block #2 end

-EDE:end

-SDE:start

$ sed "s/\(end\).*/\1/; s/\(\(start.*\)*.\)*/\1/g"

输出:

start block #1 end

第一判据\(end\).*匹配和捕获第一个结束分隔符end并替换所有替换与最近捕获的字符,这是结束分隔符。在现阶段,我们的产出是:foobar start block #1 end...

然后将结果传递给第二正则表达式。\(\(start.*\)*.\)*这与上述POSIX BRE版本相同。如果开始分隔符,则匹配单个字符。start不匹配,否则它将匹配和捕获开始分隔符,并匹配其余字符。

直接回答你的问题

使用方法2(分隔表达式),你应该选择两个适当的表达式:

  • Ede:[^:/]\/
  • SDE:http:

用法:

$ sed "s/\([^:/]\/\).*/\1/g; s/\(\(http:.*\)*.\)*/\1/" <<< "http://www.suepearson.co.uk/product/174/71/3816/"

输出:

http://www.suepearson.co.uk/

热门问答

腾讯云广州一区DNS变更,需要怎么操作?

思潮澎湃轻描淡写的生活,但思潮澎湃
推荐
我也收到相关的通知了,这里分享下~ 2019年1月31日,腾讯云将对广州地区旧的基础网络DNS服务器(10.225.30.181、10.225.30.223)进行下线。在此期间,腾讯云提供最新的DNS服务器供您更新使用。 我们建议您尽快将DNS服务器配置进行更新,并且我们为您提供...... 展开详请

快照容量与费用的比例?如何关闭停用?

帅的惊动我国计算机大神
推荐已采纳
快照已于2019年1月22日0时启动正式商业化进程,商业化后所有存量快照和新产生的快照将根据快照使用的存储容量进行收费。 在快照商业化后,腾讯云仍旧会在国内主要地域为用户提供一定量的免费额度。免费额度策略如下: 免费额度覆盖范围为中国大陆地域,中国香港及海外地域暂无免费快照额...... 展开详请

React项目的try_files机制,在COS上怎么配置?

galenye

腾讯 · 工程师 (已认证)

对象存储专业搬砖工
推荐
COS的静态网站可以设置默认索引,你这里应该是想实现react-router spa场景下刷新浏览器时,不希望报404的场景吧 可以在COS静态网站这设置一个错误文档的默认索引来实现类似try_files的功能 image.png ... 展开详请

用户主动向云服务器的号码发送短信(不是回复),该条消息能否回调给业务服务器?

推荐

您好,主动上行需配置专属上行码号,月发送量大于300万条可申请配置。未配置专属上行码号用户可先下发短信后用户回复。感谢您对腾讯云短信的支持。

语音短信,怎么才能买到深圳的号码?

推荐已采纳

您好,语音号码受运营商监管管控使用,运营商所提供的号码是专门的用途使用,当前没有深圳号码,可以关注号码池的号码状态,谢谢。

请教关于云服务的运维升级的问题?

Eli Qiao

腾讯 · 高级工程师 (已认证)

腾讯云CVM后台高级研发工程师
推荐
关于云服务的运维升级的几个问题: 1 IaaS 1.1 用户购买了IaaS,比如一个虚机;云厂商在云的运维中(例如,升级服务器),是否会升级&迁移用户的虚机到新的硬件上面;还是保留用户的虚机在老的硬件上不动,直到用户自己调整? ---- 看服务器要如何升级了,有可能迁移走,有可能...... 展开详请

所属标签

扫码关注云+社区