首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

PHP 正则表达式 获取富文本中的 img标签的src属性

前言 鄙人发现对于微信看看中的文章,一般都会有三张摘要图片; 所以想着可以直接提取富文本中的 标签的 src 属性信息; 这样就可以在前台的 文章列表中展示三张图片(建议不要多了),吸引阅读...环境 - 首先要知道,虽然正则表达式学习起来比较通用,但是不同的语言还是会有所差异; - 我选用的是 PHP语言,所以需要提醒下参考环境,虽然问题也不大 场景分析 起先我测试使用的正则表达式如下:...注意匹配的结尾形式 ([^\'\"]*) 匹配不上单引号和双引号的字符 整理后的处理源码如下: /** * 对富文本信息中的数据 * 匹配出所有的 标签的 src属性 * @param...img标签中的 src属性信息 $pattern_src = '/\bsrc\b\s*=\s*[\'\"]?...参考文章 ------ 如何通过正则表达式获取img标签的src属性 ------ PHP正则表达式,看这一篇就够啦! ②. 推荐学习—— 正则表达式 - 匹配规则

6.6K10
您找到你想要的搜索结果了吗?
是的
没有找到

PHP正则表达式笔记与实例详解

本文实例讲述了PHP正则表达式笔记与实例。分享给大家供大家参考,具体如下: 这里主要介绍如何在PHP使用正则表达式,并附带几个实例. 这两天工作用到了正则表达式,发现自己已经忘记的差不多了,囧啊!...用途:匹配、查找、替换、分割     2. php提供了两套正则表达式函数库         *1. Perl 兼容正则表达式函数(推荐使用)         2....匹配腾讯QQ号:^[1-9] $ 元字符及其在正则表达式上下文中的行为: 将下一个字符标记为一个特殊字符、一个原义字符、一个后向引用、一个八进制转义符。 ^ 匹配输入字符串的开始位置。...如果设置了 RegExp 对象的Multiline 属性,^ 也匹配 'n' 'r' 之后的位置。 $ 匹配输入字符串的结束位置。...如果设置了 RegExp 对象的Multiline 属性,$ 也匹配 'n' 'r' 之前的位置。 {n} n 是一个非负整数,匹配确定的n 次。 {n,} n 是一个非负整数,至少匹配n 次。

1.1K00

正则表达式理论篇

首先你要记住它的名字 正则表达式 regular expression 缩写 regexp 、regex 、egrep。 正则表达式可以干嘛 数据验证。 复杂的字符串搜寻、替换。...基于模式匹配从字符串中提取子字符串。 概述 正则表达式包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为“元字符”)。...第一个参数:字符串正则表达式, 第二个参数:要进行替换的字符串,也可以是函数。...没有 index 属性 input 属性。 String.split() 作用:把一个字符串分割成字符串数组。 参数:正则表达式字符串。返回:子串组成的数组。...img) 表示找一个左尖括号<,而且左尖括号<的后面没有img字符; // (?:.|\r|\n)*? 表示匹配左右尖括号里面的.\r\n,而且匹配次数为*?;(?

1.2K20

15个实用的PHP正则表达式

对于开发人员来说,正则表达式是一个非常有用的功能,它提供了 查找,匹配,替换 句子,单词,或者其他格式的字符串。这篇文章主要介绍了15个超实用的php正则表达式,需要的朋友可以参考下。...,然后找到 方法 the_title() 然后用下面代码替换掉它 echo $title; Now, just before the modified line, add this code:..., $text); 检验密码的复杂度 这个正则表达式将检测输入的内容是否包含6个更多字母,数字,下划线和连字符. 输入必须包含至少一个大写字母,一个小写字母和一个数字 'A(?...php $szPostContent = $post->post_content; $szSearchPattern = '~]* />~'; // Run preg_match_all...> 以上就是15个超实用的php正则表达式,希望对大家的学习有所帮助。

67010

《手把手带你学爬虫──初级篇》第4课 正则表达式以及re库的用法

,常简写为regex、regexp或者RE;它通常被用来快速检索、替换那些符合某个正则表达式的文本。...() 返回match对象,在字符串中搜索和正则表达式相匹配的第一个位置 re.sub() 在字符串中替换掉所有匹配正则表达式的子字符串,返回替换后的字符串 re.finditer() 在字符串中搜索匹配正则表达式的子字符串...: re.search(pattern,string,flags=0) pattern:正则表达式的字符串原生字符串表示; string:待匹配字符串; flags:正则表达式使用时的控制标记...请求的基本链接为https://search.jd.com/s_new.php,请求的基本参数我们提取为字典,其中需要控制的参数为:keyword、page、s、log_id、show_items。...log_id和show_items必须从奇数页请求结果中提取,show_items是用一个列表转化成的字符串,其中数字是,奇数页中每个带有class='gl-item'属性的div,它的data-pid

1K52

火车头采集常用的纯正则过滤

每一个段落都是   没有多余的HTML标签和与主题无关的字符   提取数据方式   选择 正则提取,组合结果填 [参数1]   有些内容开始和结尾并没有p标签,换行是用br...i)表示不区分大小写   第三步:去掉除了img标签外的所有标签的选择器样式,并把标签修改为p   正则 替换为   第五步:规范段落标签开始结束   正则 替换为   慧聪网段落只有开始没有结束   某些站个别文章,结束后没有开始就直接是下个段落的内容   第六步:把前后的空格替换为空   正则...p>)\s* 替换为 $1   第七步:把连续2个以上的替换为1个   正则 (){2,}|(){2,} 替换为 $1$2   第八步:把所有的空段落替换为空   内容 <

1.4K40

Python正则表达式

如何把一个字符串的特征规则告诉给计算机,让计算机知道你要描述的东西。被称为正则。 了解正则表达式 正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。...在很多文本编辑器里,正则表达式通常被用来检索、替换那些匹配某个模式的文本。 如何把一个字符串的特征规则告诉给计算机,让计算机知道你要描述的东西。被称为正则。...None 也可以在Match对象上用group()方法提取出子串来 如下 正则表达式的匹配规则 表示字符 字符 功能 ....php,python,web-misc" >>>d = re.split(r":|,|-",c)//用(: , -)为依据 分割字符串 >>>print(d) ['ctf', 'php', 'python...小练习 1提取图片链接 e = """ <img dataoriginal="https://rpic.douyucdn.cn/appCovers/2016/11/13/1213973_201611131917

58420

Python 正则表达式详解(建议收藏!)

提取图片地址 ---- 正则表达式是对字符串提取的一套规则,我们把这个规则用正则里面的特定语法表达出来,去匹配满足这个规则的字符串。...这样显然是不人性化的,所以我们还需要学习表达数量的字符 * 出现0次无数次 import re a = re.match('..'....*123',a,re.S)) sub 查找字符串中所有相匹配的数据进行替换 sub(要替换的数据,替换成什么,要替换的数据所在的数据) import re print(re.sub('php'...>| ','',s) # print(result) 如果关闭贪婪模式,中的内容会尽可能多的匹配,只要能够满足后面的>就行,然后xxx中xxx内容也替换掉了 提取图片地址...import re s = """<img data-original="https://img02.sogoucdn.com/app/a/100520024/36189693dc8db6bd7c0be389f8aaddbd.jpg

1.7K20

正则表达式的使用

php其实也有类似于beautifulsoup的html解析工具,没去了解,毕竟我需要的也不是太繁琐,有需要的也可以去看一下。下面具体介绍正则表达式在php中的使用。...正则表达式在php中的使用 php中支持正则表达式的函数 preg_filter 执行正则表达式搜索和替换 preg_grep 返回匹配模式的数组条目 preg_last_error...执行一个正则表达式搜索并且使用一个回调函数进行替换 preg_replace_callback 执行一个正则表达式搜索并且使用一个回调进行替换 preg_replace 执行一个正则表达式的搜索和替换...PCRE_VERSION PCRE版本号和发布日期 正则表达式的语法 元字符 \ 将下一个字符标记为一个特殊字符、一个原义字符、一个 向后引用、一个八进制转义符。...如果设置了 RegExp 对象的 Multiline 属性,则 $ 也匹配 ‘\n’ ‘\r’。要匹配 $ 字符本身,请使用 \$。 ( ) 标记一个子表达式的开始和结束位置。

89620

PHP中使用DOMDocument来处理HTML、XML文档

PHP中使用DOMDocument来处理HTML、XML文档 其实从PHP5开始,PHP就为我们提供了一个强大的解析和生成XML相关操作的类,也就是我们今天要讲的 DOMDocument 类。...不过我估计大部分人在爬取网页时还是会喜欢用正则去解析网页内容,学了今天的这个类下回就可以尝试下使用这个PHP自带的方式来进行解析分析了。...然后就可以获取它的值、属性之类的内容了。...相比正则来说,是不是方便很多,而且代码本身就是自解释的,不用考虑正则的匹配失效的问题。配合另外一个PHP中自带的 parse_url() 方法也能非常方便地对链接进行分析,提取自己想要的内容。...使用 createElement() 方法创造 DOMElement 对象,然后就可以为它添加属性和内容。

2.4K10

白帽赏金平台XSS漏洞模糊测试有效载荷最佳集合 2020版

摘要 基本 高级 绕过 利用 额外 枚举 内容 1.HTML Injection (代码注入)当输入的payload,被插入到HTML标签外部标签的属性值内时,则使用下面的方法进行测试,如果输入的内容被插入到了...alert(1)> 19.PHP Self URL Injection (PHP self URL注入)当网站服务器端PHP代码,将当前URL当作HTML表单属性值进行获取。...第一个payload是原始形式,第二个payload是eval,它使用payload的id属性替换 eval。URL必须采用以下方式:在PHP扩展后的URL路径中URL的片段中。...这个 svg标记将使下一个脚本块中的单引号编码为 ' ',并触发弹窗。...如果以某种方式过滤 ">",请将 "r=>" "w=>"替换为 "function()"。

9.3K40

送书|学正则表达式,看这一篇就够了!

,它有自己特定的语法结构,有了它,实现字符串的检索、替换、匹配验证、在HTML里提取想要的信息都是简简单单的事。...:匹配任意字符,除了换行符,当re.DOTALL标记被指定时,则可以匹配包括换行符的任意字符; *:匹配0个多个表达式; ?...注意:str模块也有个split方法,主要区别是str.split不支持正则分割,re.split支持正则替换 re.sub():用于替换字符串中的匹配项; re.subn():用于替换字符串中的匹配项...小技巧 匹配目标 如何中一段文本中提取一部分内容呢,我们可以使用()括号将想提取的子符串括起来,它标记了一个子表达式的开始和结束位置,被标记的每个子表达式会依次对应每个分组,调用group()方法传入分组的索引即可获得提取的结果...正则提取 在上一步中,我们已经成功提取了源代码,接下来就要构造正则表达式把我们想要的内容提取出来存放在字典中,这里我们使用了非贪婪匹配。

68520

PHP正则的使用

正则表达式,作为一种快速、便捷的处理字符串的工具,在各种编程语言中都有着广泛的用途,通过在PHP中的一些使用,下面记录一下关于PHP正则使用的一些技巧。...正则表达式: 用于描述字符排列和匹配模式的一种语法规则。它主要用于字符串的模式分割、匹配、查找及替换操作。.../i PCRE的模式单元: //1 提取第一位的属性 /^\d{2} ([\W])\d{2}\\1\d{4}$匹配“12-31-2006”、“09/27/1996”、“86 01 4321”等字符串。...,我们可以通过PHP手册来找到,下面分享一些平时积累的正则表达式:     匹配action属性     $str = ')/', $str, $match );     echo "匹配没有属性的HTML标签中的内容:";     print_r ( $match );     替换HTML源码中的地址

3.7K30

php正则表达式的分组捕获

经过测试,发现php正则表达式获取分组捕获是从$0开始,而平时工作中JavaScript中的正则是$1..$9 在提取项目代码中的汉字时,因为当时操作速度很快(赶时间),很担心当时.properties...一多就容易出错,而且行与行之间靠的太近了,字又太小… 突然想起来,觉得php可以节省一点时间,读取文件,然后将关键的地方标红… 然后就开始了:php读取文件,然后逐行的读取,使用正则表达式匹配符合{\d...}的行,然后将{\d}的地方使用红色进行重点的标记,之后人工去查看每一行是能是符合规则。...> 27: 参考问题: 用 PHP 读取文件的正确方法 掌握 PHP 中的正则表达式(1) 掌握 PHP 中的正则表达式(2) 准备趁春节放假那几天再把《精通正则表达式》...好好温习温习,深入研究一下php、perl、python中正则的异同点。

1.4K30
领券