首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

python爬虫-解析网页的几种方法之BeautifulSoup

python爬虫--解析网页的几种方法之BeautifulSoup

之前文章已经介绍了在python中用正则表达式抓取网页信息,本文将介绍用BeautifulSoup库抓取信息。

BeautifulSoup是Python的一个库,最主要的功能就是从网页爬取我们需要的数据。BeautifulSoup将html解析为对象进行处理,全部页面转变为字典或者数组,相对于正则表达式的方式,可以大大简化处理过程。

一、安装库

pipinstallbeautifulsoup4

BeautifulSoup默认支持Python的标准HTML解析库,但是它也支持一些第三方的解析库:

二、使用beautifulsoup4抓取新闻网站新闻标题。

代码如下:

方听木说∣一个有用的公众号

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180326G1MRQ600?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券