前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python实战:美女图片下载器,海量图片任你下载

Python实战:美女图片下载器,海量图片任你下载

作者头像
做全栈攻城狮
发布2018-12-20 10:49:09
1.4K0
发布2018-12-20 10:49:09
举报
文章被收录于专栏:做全栈攻城狮做全栈攻城狮

Python应用现在如火如荼,应用范围很广。因其效率高开发迅速的优势,快速进入编程语言排行榜前几名。本系列文章致力于可以全面系统的介绍Python语言开发知识和相关知识总结。希望大家能够快速入门并学习Python这门语言。

本文是在前一部分Python基础之上Python实战:Python爬虫学习教程,获取电影排行榜,再次升级的Python网页爬虫实战课程。

1.项目概述。

利用XPath和requests模块进行网页抓取与分析,达到网页图片下载的效果。

抓爬图片地址:http://www.2cto.com/meinv/

开发环境:python 2.7、PyCharm 5 Community

所需知识:神器XPath、Requests模块、Python基本语法。

2.所需模块介绍及安装

Xpath

介绍:XPath其实是一门可以在XML中通过元素的属性进行查找提取信息的一门语言。它支持HTML。

与正则表达式相比,更简单。更强大

安装:下载lxml库进行安装操作。下载地址:http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml。下载对应版本的lxml

打开库目录运行命令进行安装

下载完成之后,请把后缀名whl改为zip。

解压文件把lxml文件夹放入python安装目录的lib文件夹下。

Requests模块安装

具体详细安装步骤请参阅:Python实战:Python爬虫学习教程,获取电影排行榜中requests的安装。

3.Xpath提取查找内容详解:

是语言都不例外,Xpath也有一定语法。

// 定位根节点

/ 往下层寻找

/text() 提取文本内容

/@xxx 提取属性内容

4.项目主体代码

from lxml import etree

selector = etree.HTML(网页源代码)

selector.xpath(xpath语法)

import requests

requests.get(url)

5.代码演示:

效果展示:

小技巧:xpath简单获取:开发人员工具-定位要提取的标签-右键如图所示可以复制xpath路径。

但尚需修改哦。

欢迎关注今日头条:做全栈攻城狮。Python实战:美女图片下载器,海量图片任你下载。

QQ技术交流群: 538742639

项目源码请关注微信公众平台:fullstackcourse 做全栈攻城狮。回复:”美女图片下载器”获取。

下篇:Python学习入门教程,字符串函数扩充详解

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2016.09.21 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档