前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >python爬虫网页解析之lxml模块

python爬虫网页解析之lxml模块

作者头像
小小咸鱼YwY
发布2019-09-11 14:20:22
6700
发布2019-09-11 14:20:22
举报
文章被收录于专栏:python-爬虫python-爬虫

08.06自我总结

python爬虫网页解析之lxml模块

一.模块的安装

windows系统下的安装:

方法一:pip3 install lxml

方法二:下载对应系统版本的wheel文件:http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml

pip3 install lxml-4.2.1-cp36-cp36m-win_amd64.whl #文件所在的路径

linux下安装:

方法一:pip3 install lxml

方法二:yum install -y epel-release libxslt-devel libxml2-devel openssl-devel

二.模块的使用

from lxml.html import etree

演示

代码语言:javascript
复制
import requests
from lxml.html import etree

rp = requests.get('http://www.baidu.com')
html = etree.HTML(rp.text)
#解析后的对象可以使用xpath进行内容匹配
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2019-08-06 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 08.06自我总结
  • python爬虫网页解析之lxml模块
    • 一.模块的安装
      • 二.模块的使用
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档