首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

正则表达式以查找字符串中的URL

正则表达式以查找字符串中的URL

正则表达式(Regular Expression,简称 regex)是一种强大的文本处理工具,可以用来搜索、匹配和操作字符串。在搜索 URL 时,可以使用以下正则表达式:

代码语言:txt
复制
(?i)\b((?:https?:(?:/{1,3}|[a-z0-9%])|[a-z0-9.\-]+[.](?:com|net|org|edu|gov|mil|aero|asia|biz|cat|coop|info|int|jobs|mobi|museum|name|post|pro|tel|travel|xxx|ac|ad|ae|af|ag|ai|al|am|an|ao|aq|ar|as|at|au|aw|ax|az|ba|bb|bd|be|bf|bg|bh|bi|bj|bm|bn|bo|br|bs|bt|bv|bw|by|bz|ca|cb|cc|cd|cf|cg|ch|ci|ck|cl|cm|cn|co|cr|cs|cu|cv|cx|cy|cz|dd|de|dj|dk|dm|do|dz|ec|ee|eg|eh|er|es|et|eu|fi|fj|fk|fm|fo|fr|ga|gb|gd|ge|gf|gg|gh|gi|gl|gm|gn|gp|gq|gr|gs|gt|gu|gw|gy|hk|hm|hn|hr|ht|hu|id|ie|il|im|in|io|iq|ir|is|it|je|jm|jo|jp|ke|kg|kh|ki|km|kn|kp|kr|kw|ky|kz|la|lb|lc|li|lk|lr|ls|lt|lu|lv|ly|ma|mc|md|me|mg|mh|mk|ml|mm|mn|mo|mp|mq|mr|ms|mt|mu|mv|mw|mx|my|mz|na|nc|ne|nf|ng|ni|nl|no|np|nr|nu|nz|om|pa|pe|pf|pg|ph|pk|pl|pm|pn|pr|ps|pt|pw|py|qa|re|ro|rs|ru|rw|sa|sb|sc|sd|se|sg|sh|si|sj|ja|sk|sl|sm|sn|so|sr|ss|st|su|sv|sx|sy|sz|tc|td|tf|tg|th|tj|tk|tl|tm|tn|to|tp|tr|tt|tv|tw|tz|ua|ug|uk|us|uy|uz|va|vc|ve|vg|vi|vn|vu|wf|ws|ye|yt|yu|za|zm|zw)\b/?(?!@)))

这个正则表达式会匹配 URL 的完整格式或部分链接,如:

  • https://www.example.com
  • example.com
  • http://example.com
  • example.com/path?query=value
  • https://example.com/path#fragment
  • example.com?query=value

请注意,这个正则表达式并未涵盖所有可能的 URL 格式。如果你需要处理更复杂的 URL 格式,可能需要使用更复杂的正则表达式。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

字符串查找子串_cstring查找字符串

大家好,又见面了,我是你们朋友全栈君。 子串查询 首先,我们来定义两个概念,主串和模式串。我们在字符串 A 查找字符串 B,则 A 就是主串,B 就是模式串。...我们把主串长度记为 n,模式串长度记为 m。由于是在主串查找模式串,因此,主串长度肯定比模式串长,n>m。因此,字符串匹配算法时间复杂度就是 n 和 m 函数。...如果持续相等直到 t 最后一个字符,则匹配成功。 如果发现一个不等字符,则重新回到前面的步骤查找 s 是否有字符与 t 第一个字符相等。...字符串匹配算法案例 最后我们给出一道面试中常见高频题目,这也是对字符串匹配算法进行拓展,从而衍生出问题,即查找出两个字符串最大公共字串。...首先,你需要对于字符串 a 和 b 找到第一个共同出现字符,这跟前面讲到匹配算法在主串查找第一个模式串字符一样。

3K30

正则表达式查找提取替换字符串

C++11标准支持正则表达式后,使用正则表达式查找、提取、替换字符串就无需使用第三方开源库。...类regex,用来存放正则表达式,其实就是一个字符串,只需关心构造函数,其需要一个字符串作为参数进行对象构造。正则表达式语法遵循ECMAScript标准。...类smatch,用来存放查找、提取操作结果,其实就是一个ssub_match数组,正则表达式语法支持使用括号来获得某个子匹配,所以匹配结果会有多个,第一个存完整匹配结果,其它存正则表达式指定子匹配...m, regex e); 第1个版本简单判断是否找到,指定搜索字符串查找正则表达式 第2个版本除了判断是否找到外,还可以指定smatch对象获取查找结果。...比如字符串 subsentence,对于正则表达式sub来说,regex_match()是失败,因为尾部sentence没有被匹配到,regex_search()是成功

4.5K40
  • Java在字符串查找匹配字符串

    示例: 在源字符串“You may be out of my sight, but never out of my mind.”查找“my”个数。...指定为字符串正则表达式必须首先被编译为此类实例。然后,可将得到模式用于创建 Matcher 对象,依照正则表达式,该对象可以与任意字符序列匹配。...find 方法扫描输入序列查找与该模式匹配下一个子序列 //方法2、通过正则表达式 private void matchStringByRegularExpression( String parent...该方法作用就像是使用给定表达式和限制参数 0 来调用两参数 split 方法。因此,所得数组不包括结尾空字符串。...完整代码: import java.util.Arrays; import java.util.regex.Matcher; import java.util.regex.Pattern; /** * 在字符串查找匹配字符串

    7.1K20

    字符串查找----查找算法选择

    首先来对比一下通用查找算法和字符串查找算法: 各种字符串查找算法性能特点 算法(数据结构) 优点 二叉查找树(BST) 适用于随机排列键 2-3树查找(红黑树) 有性能保证 线性探测法(并行数组)...内置类型,缓存散列值 R向单词查找树 适用于较短键和较小字母表 三向单词查找树 适用于非随机键 如果空间足够,R向单词查找速度是最快,能够在常数次次数比较内完成查找。...对于大型字母表,R向单词查找树所需空间可能无法满足时,三向单词查找树是最佳选择,因为它对字符比较次数是对数级别的,而二叉查找树中键比较次数是对数级别的。...散列表也很有用,但它不支持有序性符号表操作,也不支持扩展字符类API操作。

    3.1K00

    字符串匹配:字符串查找某子串

    需求 我们在平时软件开发,尤其是嵌入式开发,字符串匹配是非常重要一个算法。而目前常用字符串匹配算法有很多,下面就来介绍几个。...具体算法 常规方法 对于字符串存放在字符数组定长顺序存储结构,可以利用计数指针指示主串和模式串当前正在比较字符位置。算法基本思路是:从主串第i个字符起和模式串第一个字符比较。...若相等,则继续比较后续字符;否则从主串下一个字符起再重新和模式串第一个开始比。知道模式串被比较完成,代表主串存在模式串。...next 数组各值含义:代表当前字符之前字符串,有多大长度相同前缀后缀。例如如果next [j] = k,代表j 之前字符串中有最大长度为k 相同前缀后缀。...这就意味着在某个字符失配时,该字符对应next 值会告诉你下一步匹配,模式串应该跳到哪个位置(跳到next [j] 位置)。

    1.4K30

    URL#

    作者:阮一峰   http://www.ruanyifeng.com/blog/2011/03/url_hash.html 一、#涵义 #代表网页一个位置。其右面的字符,就是该位置标识符。...二、HTTP请求不包括# #是用来指导浏览器动作,对服务器端完全无用。所以,HTTP请求不包括#。...五、改变#会改变浏览器访问历史 每一次改变#后部分,都会在浏览器访问历史增加一个记录,使用"后退"按钮,就可以回到上一个位置。...八、Google抓取#机制 默认情况下,Google网络蜘蛛忽视URL#部分。 但是,Google还规定,如果你希望Ajax生成内容被浏览引擎读取,那么URL可以使用"#!"...,Google会自动将其后面的内容转成查询字符串_escaped_fragment_值。 比如,Google发现新版twitterURL如下:   http://twitter.com/#!

    1.8K10

    Vim查找替换及正则表达式使用详解

    前言 正则表达式是文本处理领域中一个强大工具,它可以让文本处理能力呈指数级提升,如果一款文本编辑器不支持正则表达式,那么它就算不上是一个现代化编辑器,这绝非虚言。...下面这篇文章主要跟大家介绍了关于Vim查找替换及正则表达式使用相关内容,分享出来供大家参考学习,下面来一起看看吧。...如果不加g选项,则只替换每行第一个匹配到字符串; i ignore,忽略大小写。 这些选项可以合并使用,如cgi表示不区分大小写,整行替换,替换前询问。...正则表达式 1、元字符 元字符 元字符 说明 . 匹配任意字符 [abc] 匹配方括号任意一个字符,可用-表示字符范围。...匹配单词词尾 2、替换变量 在正则式\(和\)括起来正则表达式,在后面使用时候可以用\1、\2等变量来访问\(和\)内容。

    5.9K10

    Aptana与Editplus查找并替换正则表达式应用

    平时编写JavaScript,我用最多就是Aptana与Editplus 复杂、多人协作时候会使用Aptana,简单、单个作战时候通常会选用Editplus,而在开发过程或多或少需要用到正则表达式去替换一些字符串...span>类似的结构,并进行一些处理,思路: 1、查找到需要匹配字符串 2、对匹配字符串进行一些替换操作 问题: 如何编写查找此类字符串正则表达式?...(二个编辑器,正则不一样但思路一致) 先分析这段字符串格式: + ([^ a、前面匹配这个好理解 ---注:中间没有空格...:) c、匹配使用了“反向引用”--- \1,因为需要确保前面出现xx一致 Aptana为例,最终表达式:(?...在替换处可以使用你需要替换规则,其中$0表示参与匹配正则表达式字符串,$1…为最近使用()捕获分组字符串 而在Editplus,它对使用正则表达式进行查找和替换仅支持有限正则量词(详细可自行搜索

    1.2K30

    java查找字符串字符_java – 查找字符串中最常见字符更有效方法

    参考链接: Java程序查找一个字符ASCII值 执行此操作最快方法是计算每个字符出现次数,然后取计数数组最大值.如果您字符串很长,那么在循环字符串字符时,不会跟踪当前最大值,您将获得不错加速...如果你字符串主要是ASCII,那么count循环中一个分支可以在低128字符值数组或其余HashMap之间进行选择,这应该是值得.如果您字符串没有非ASCII字符,分支将很好地预测.如果在ascii...这可能比你2 ^ 16整数数组更好.但是,如果您只触摸此阵列低128个元素,则可能永远不会触及大部分内存.分配但未触及内存并没有真正伤害,或者耗尽RAM /交换.  ...但是,在末尾循环遍历所有65536个条目意味着至少读取它,因此操作系统必须对其进行软页面故障并将其连接起来.它会污染缓存.实际上,更新每个角色最大值可能是更好选择....Microbenchmarks可能会显示迭代字符串,然后循环遍历charcnt [Character.MAX_VALUE]获胜,但这不会解释缓存/ TLB污染触及那么多非真正需要内存.

    1.1K30

    go从已知列表查找字符串

    01 May 2016 go从已知列表查找字符串 最近在开发遇到一个需求,需要查找某个给定字符串是否属于有效字符串。...例如以下字符串都是有效字符串: "key1" "key2" "key3" "key4" "key5" "key6" 若查找字符串是key1,存在key1,所以key1是有效字符串,若查找字符串是key0...,但是该方式查找效率最高,时间复杂度为常数O(1),所以一般推荐使用; 方式二由于需要遍历所有字符串,时间复杂度是O(N),N是切片长度,随着长度增大,查找时间越长,但是相比方式四,代码少了很多,谨记代码越少出错概率越小...,要想软件没有bug,唯一方法就是不写代码; 方式三通过使用go标准库sort,将切片先排序后,使用二分法查找目标字符串,算法复杂读相对方式二和方式四较好,为O(logN),N为切片长度,可读性较好,...若查找字符串是key1,则时间复杂度O(1),但是若查找字符串是最后一个字符串时,时间复杂度和方式二一样,都是O(N),N表示字符串个数,但是该方式没有没有使用任何数据结构,如果对内存开销要求高,可以推荐使用

    2.8K70
    领券