首页
学习
活动
专区
工具
TVP
发布

JAVAandPython君

专栏作者
272
文章
341402
阅读量
38
订阅数
K哥把正则表达式知识肝完了!
其实写过爬虫的朋友知道,我们有时候需要提取html中的一些特定内容,这个时候用正则就显得会方便很多。
Python进击者
2021-05-07
3990
正则表达式很难吗?其实也就那样!
Hello,元宵节过了,这个年也算是过完了,接下来就得看我们2019年的奋斗了,2019年JAP君会一直陪着大家一起学习!今天我们来学习一下号称最难学的正则表达式,正则表达式在我们写爬虫的时候确实是一个很好的帮手,因为有一些网站的数据可能并不是那么的规整或者数据太多,我们只需要部分数据的时候,此时我们就可以通过一些表达式来进行提取,正则表达式就是其中一种进行数据筛选的表达式。
Python进击者
2019-09-17
9230
Scrapy框架| 选择器-Xpath和CSS的那些事
这次接着上一篇文章来讲Scrapy框架,这次讲的是Scrapy框架里面提供的两种数据提取机制Xpath和CSS,其实除了这两种,我们还可以借助第三方库来实现数据的提取,例如:BeautifulSoup(这个在我的爬虫系列文章中有写过)和lxml(Xml解析库),Scrapy选择器是基于lxml库之上的,所以很多地方都是和lxml相似的。
Python进击者
2019-06-21
1.2K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档