前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >正则表达式 “双向最小匹配”

正则表达式 “双向最小匹配”

作者头像
明明如月学长
发布2021-08-27 11:45:03
1.8K0
发布2021-08-27 11:45:03
举报

最近做一个 字符串查找的例子从字符串中提取制定内容

如下:

代码语言:javascript
复制
  String input = " 
代码语言:javascript
复制
   rel=\"shadowbox;width=720\">外観図面";

需要提取   "authentication.html?file=KF619L_Z.pdf"

代码 如下:

代码语言:javascript
复制
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Text.RegularExpressions;
using System.Threading.Tasks;

namespace regDemo
{
    class Program
    {
        static void Main(string[] args)
        {
            String input = " 外観図面";
            Console.WriteLine(getCenterString(input, "href=\"", "\" class="));
            Console.ReadKey();

        }

        public static String getCenterString(String input,String left,String right)
        {

            Match match = Regex.Match(input, left + "(.+?)" + right);
            while (match.Success)
            {
                return match.Groups[1].Value;
            }
            return "";  
        }
    }
}

中间加了 ?  目的是  非贪婪匹配。

但是效果并不理想,效果如下:

按照最小匹配原则,原则上我们应该得到理想结果,但是却没有。

这是因为在正则的解释器中,对于最小匹配原则的理解为正向最小匹配,

而不是双向最小匹配。

左侧匹配后 定住左侧边界   直到找到右侧为止

我们换个思路:

中间包含在我们左侧的字符即可,

我们对代码进行改进:

代码语言:javascript
复制
 Match match = Regex.Match(input, left + "(((?!" + left + ").)+?)" + right);

得到了我们想要的结果:

补充:

【零宽断言】

正则表达四一些字符可以匹配一句话的开始、结束(^ $)或者匹配一个单词的开始、结束(\b)。这些元字符只匹配一个位置,指定这个位置满足一定的条件,而不是匹配某些字符,因此,它们被成为 零宽断言。所谓零宽,指的是它们不与任何字符相匹配,而匹配一个位置;所谓断言,指的是一个判断。正则表达式中只有当断言为真时才会继续进行匹配。

在有些时候,我们精确的匹配一个位置,而不仅仅是句子或者单词,这就需要我们自己写出断言来进行匹配。下面是断言的语法:

断言语法

说明

(?=pattern)

前向肯定断言,匹配pattern前面的位置

(?!pattern)

前向否定断言,匹配后面不是pattern的位置

(?<=pattern)

后向肯定断言,匹配pattern后面的位置

(?

后向否定断言,匹配前面不是pattern的位置

更多参考:http://www.cnblogs.com/youring2/archive/2009/11/07/1597786.html

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2015/10/06 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档