专栏首页py+seleniumpython爬虫笔记之re.match匹配,与search、findall区别

python爬虫笔记之re.match匹配,与search、findall区别

为什么re.match匹配不到?re.match匹配规则怎样?(捕一下seo) 

re.match(pattern, string[, flags])

pattern为匹配规则,即输入正则表达式。

string为,待匹配的文本或字符串。

网上的定义【 从要匹配的字符串的头部开始,当匹配到string的尾部还没有匹配结束时,返回None;  当匹配过程中出现了无法匹配的字母,返回None。】 

但我觉得要强调关键一句【仅从要匹配的字符串头部开始匹配!】

看看例子,你就明白了!!!想用的话,一定要看!

出现<_src.SRE_Match object at .....>表示匹配成功。

出现None表示,匹配失败或未匹配到。

总结:re.match只从待匹配的字符串或文本的开头开始匹配,即如果匹配的字符串不在开头,而是在中间或结尾,则无法匹配!

———————————————————分割线——————————————————

顺便对比下re.match、re.search、re.findall的区别

match()函数只在string的开始位置匹配(例子如上图)。

search()会扫描整个string查找匹配,会扫描整个字符串并返回第一个成功的匹配。

 re.findall()将返回一个所匹配的字符串的字符串列表

 ———————————————————分割线——————————————————

《用python写网络爬虫》中1.4.4链接爬虫中,下图为有异议代码

 这里的输出经测试,根本啥也没有,如下图

查了很久,应该是因为re.match一直匹配不到数据引起的,毕竟他只匹配开头。

将re.match改为re.search,再测试,可正常下载

分析:可能是由于书编写时,http://example.webscraping.com/页面所带的链接都是:/index/1、/index/2……且输入匹配表达式为  【   /(index/view)   】,使用的是re.match匹配,如果匹配上述的url则没问题,而现在该网站页面所带的链接为:/places/default/index/1、/places/default/index/2……所以,上文讲到的re.match的特点,从开头开始匹配,则这时候re.match就会一直匹配不上!我将它换位re.search就可以解决这个问题了。

如有错误,麻烦及时指正,谢谢!

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • python爬虫笔记之re.IGNORECASE

           re.IGNORECASE有什么用?re.IGNORECASE是什么意思?(原谅我抓下seo。。)

    逆向小白
  • py+selenium IE 定位到元素,但点击不了元素的问题【已解决】

     参考:https://www.cnblogs.com/gihyuqinqin/p/8067685.html

    逆向小白
  • python爬取连续一字板股票及当时日期数据【原创分享】

    逆向小白
  • python 历险记(六)— pytho

    刚接触正则表达式,我也曾被它们天书似的符号组合给吓住,但经过一段时间的深入学习,发现它并没有想象中那么可怕,只要多实践,多理解,也是可以轻松搞定的。 而且我发...

    py3study
  • 简单的正则表达式

    特殊字符 ^ $ * ? + {2} {2,} {2,5} | [] [^] [a-z] . \s \S \w \W [\u4E00-\u9FA5] ...

    听城
  • Python学习(二) 正则表达式

    Python正则表达式 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。re 模块使 Python 语言拥有全部的正则表达式功...

    深度学习思考者
  • 万字长文详解Python正则表达式及re模块

    大家好,偷学Python系列是由小甜同学从初学者的角度学习Python的笔记,其特点就是全文大多由新手易理解的代码与注释及动态演示。刚入门的读者千万不要错过!

    叫我龙总
  • 语义分割

    SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation...

    用户1148525
  • 17张思维导图,一网打尽机器学习统计基础(附下载)

    来源:大数据文摘 作者:小越酱 原文: https://zhuanlan.zhihu.com/p/25884239?utm_medium=social&utm_...

    数据派THU
  • 系统设计中的权衡取舍

    关注「前端向后」微信公众号,你将收获一系列「用心原创」的高质量技术文章,主题包括但不限于前端、Node.js以及服务端技术

    ayqy贾杰

扫码关注云+社区

领取腾讯云代金券