首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

数据提取-Beautiful Soup

Beautiful Soup的简介 Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。...Beautiful Soup自动将输入文档转换为Unicode编码,输出文档转换为utf-8编码。...你不需要考虑编码方式,除非文档没有指定一个编码方式,这时,Beautiful Soup就不能自动识别编码方式了。然后,你仅仅需要说明一下原始编码方式就可以了。...Beautiful Soup 安装 Beautiful Soup 3 目前已经停止开发,推荐在现在的项目中使用Beautiful Soup 4,不过它已经被移植到BS4了,也就是说导入时我们需要 import...Soup会当作UTF-8编码,可以传入一段Unicode 编码来避免Beautiful Soup解析编码出错 # 5.1.2 正则表达式 如果传入正则表达式作为参数,Beautiful Soup会通过正则表达式的

1.2K10

使用 Beautiful Soup 解析网页内容

安装Beautiful Soup Beautiful Soup是一个Python的HTML解析框架,我们可以利用它方便的处理HTML和XML文档。...Beautiful Soup有3和4两个版本,目前3已经停止开发。所以我们当然还是学习最新的Beautiful Soup 4. 首先第一件事情就是利用pip安装Beautiful Soup。...pip install beautifulsoup4 稍等片刻之后Beautiful Soup就安装好了。这样,我们就可以开始使用它了。...如果需要详细文档的话可以参考Beautiful Soup中文文档,这是难得的不是机翻的文档。...解析文档 获取文档 Beautiful Soup只是一个HTML解析库,所以我们如果想解析网上的内容,第一件事情就是把它下载下来。对于不同的网站,可能会对请求进行过滤。

2.9K90
领券