学习
实践
活动
专区
工具
TVP
写文章

送给人类的 HTML 解析库

阅读本篇预计需要 2 分钟

也就在前天他又开源了一个项目requests-html,和之前的 Requests 一样介绍语还是那么霸气:

HTML Parsing for Humans

简单的说,requests-html 是一个解析 html 的 Python 第三方库。同时它支持 CSS 选择器、XPath、Mock UA、自动进行重定向、连接池以及 Cookies。总之就是一个非常简单、实用的 HTMl 解析库。

了解 Requests 的读者应该知道,Kenn 开源的项目都有一个突出的亮点就是这些库都封装的很简单、以及特别实用。就像 Requests 是对 urllib、urllib3 的上层封装,大大的方便了我们平时的网络开发。

所以,不难猜出 requests-html 其实也是一个封装起来的组件库,内部核心则是 lxml 库等。

接下来就来看看这个库怎么用:

1. 安装

2. 使用

具体的使用文档,见下方链接:

https://github.com/kennethreitz/requests-html

也可以在这搜索 requests_html

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180227G1164M00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

同媒体快讯

关注

腾讯云开发者公众号
10元无门槛代金券
洞察腾讯核心技术
剖析业界实践案例
腾讯云开发者公众号二维码

扫码关注腾讯云开发者

领取腾讯云代金券