阅读本篇预计需要 2 分钟
也就在前天他又开源了一个项目requests-html,和之前的 Requests 一样介绍语还是那么霸气:
HTML Parsing for Humans
简单的说,requests-html 是一个解析 html 的 Python 第三方库。同时它支持 CSS 选择器、XPath、Mock UA、自动进行重定向、连接池以及 Cookies。总之就是一个非常简单、实用的 HTMl 解析库。
了解 Requests 的读者应该知道,Kenn 开源的项目都有一个突出的亮点就是这些库都封装的很简单、以及特别实用。就像 Requests 是对 urllib、urllib3 的上层封装,大大的方便了我们平时的网络开发。
所以,不难猜出 requests-html 其实也是一个封装起来的组件库,内部核心则是 lxml 库等。
接下来就来看看这个库怎么用:
1. 安装
2. 使用
具体的使用文档,见下方链接:
https://github.com/kennethreitz/requests-html
也可以在这搜索 requests_html
领取专属 10元无门槛券
私享最新 技术干货