首页
学习
活动
专区
工具
TVP
发布

进击的Coder

专栏作者
552
文章
1258020
阅读量
199
订阅数
有了这个库,以后再也不用写正则表达式了!
这是「进击的Coder」的第 715 篇技术分享 作者:崔庆才 正则表达式大家应该有了解过吧?它功能很强大,但有一个痛点就是不太容易读写,我们需要了解正则的很多语法规则才能写出一个健壮的正则表达式,很多朋友估计听到正则表达式估计都焦头烂额了。 就没有解决办法吗? 有的,今天给大家介绍一个可以让我们用“人类”的方式来写正则表达式的库。 Humre 没错,这个库就是 Humre,就是 Human(人类) + re(正则表达式) 的组合,单看这个名字还是很有来头啊。 GitHub 地址:https://gith
崔庆才
2022-09-06
4550
Scrapy框架的使用之Selector的用法
Scrapy提供了自己的数据提取方法,即Selector(选择器)。Selector是基于lxml来构建的,支持XPath选择器、CSS选择器以及正则表达式,功能全面,解析速度和准确度非常高。 本节将介绍Selector的用法。 1. 直接使用 Selector是一个可以独立使用的模块。我们可以直接利用Selector这个类来构建一个选择器对象,然后调用它的相关方法如xpath()、css()等来提取数据。 例如,针对一段HTML代码,我们可以用如下方式构建Selector对象来提取数据: from
崔庆才
2018-06-25
1.9K0
使用requests+正则表达式爬取猫眼电影排行
本节中,我们利用requests库和正则表达式来抓取猫眼电影TOP100的相关内容。requests比urllib使用更加方便,而且目前我们还没有系统学习HTML解析库,所以这里就选用正则表达式来作为解析工具。 1. 本节目标 本节中,我们要提取出猫眼电影TOP100的电影名称、时间、评分、图片等信息,提取的站点URL为http://maoyan.com/board/4,提取的结果会以文件形式保存下来。 2. 准备工作 在本节开始之前,请确保已经正确安装好了requests库。如果没有安装,可以参考第1章
崔庆才
2018-04-18
1.4K0
正则表达式中零宽断言的用法
了解了正则表达式,想必一般情况下的匹配都不会出现什么问题,但是如果一些特殊情况,可能需要用到一些更高级的正则表达式匹配操作,本节我们来说明一下正则表达式的一个较常用又比较重要的知识点——零宽断言。 实例引入 首先我们来看一个例子,这里有一段问答对话: 问:我用的是Windows XP+Service Pack 2,为什么无法安装输入卡号和密码的控件? 答:在Windows XP+Service Pack 2、Windows 2003等操作系统中,用户可以自己选择是否安装控件。 问:为什么我看到的卡号输入框
崔庆才
2018-04-04
1.1K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档