前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >scrapy选择器css

scrapy选择器css

作者头像
py3study
发布2018-08-02 15:53:16
4940
发布2018-08-02 15:53:16
举报
文章被收录于专栏:python3

CSS是网页代码中非常重要的一环,即使不是专业的Web从业人员,也有必要认真学习一下

CSS选择器

.class                .intro              选择class="intro"的所有元素

#id                   #firstname          选择id="firstname"的所有元素

*                     *                   选择所有元素

element               p                   选择所有元素

element,element       div,p               选择所有元素和所有元素

element.element       div p               选择元素内部的所有p元素

[attribute]           [target]            选择带有target属性的所有元素

[attribute=value]     [target=_blank]     选择target="_blank"的所有元素

与XPath选择器相比,CSS选择器稍微复杂一点点,但其强大的功能弥补了这个缺陷

还是之前的spuerHero.xml文件做练习

代码语言:javascript
复制
<superhero>
    <class>
        <name>Tony Stark </name>
        <alias>Iron Man </alias>
        <sex>male </sex>
        <birthday>1969 </birthday>
        <age>47 </age>
    </class>
    <class>
        <name>Peter Benjamin Parker </name>
        <alias>Spider Man </alias>
        <sex>male </sex>
        <birthday>unknow </birthday>
        <age>unknow </age>
    </class>
    <class>
        <name>Steven Rogers </name>
        <alias>Captain America </alias>
        <sex>male </sex>
        <birthday>19200704 </birthday>
        <age>96 </age>
    </class>
</superhero>

练习1,代码如下

Selector(text=body).css('class').extract()

执行结果

blob.png
blob.png

练习2,代码如下

Selector(text=body).css('class name').extract()

执行结果

blob.png
blob.png

练习3,代码如下

Selector(text=body).css('class name').extract()[0]

执行结果

blob.png
blob.png

练习4,代码如下

Selector(text=body).css('[lang="en"]').extract()

执行结果

blob.png
blob.png

因为CSS选择器和XPath选择器都可以嵌套使用,所以它们可以互相嵌套,这样一来收集数据更加方便

其它选择器

XPath选择器还有一个.re()方法,用于通过正则表达式来提取数据。然而,不同于使用.xpath()或者.css()方法,.re()方法返回unicode字符串的列表,所以无法构造嵌套式的.re()调用,这种方法不常用。这里就不做示例了,有兴趣可以自行google

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2017/12/13 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档