前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python使用BeautifulSoup4进行HTML解析

Python使用BeautifulSoup4进行HTML解析

作者头像
文曦
发布2022-06-09 15:26:40
8190
发布2022-06-09 15:26:40
举报
文章被收录于专栏:壳屋栏博客专栏

Beautifulsoup4 导入模组

代码语言:javascript
复制
from bs4 import BeautifulSoup
import requests as req

Beautifulsoup4 美化 HTML 代码

代码语言:javascript
复制
# 设定网址
url = "https://k5l.cn/"

# 获取网页html 
r = req.get(url)

# 导入 html 进入 beautifulsoup4
soup = BeautifulSoup(r.text, features="html.parser")

# 美化 html 代码
print(soup.prettify())

Beautifulsoup4 获取 title 标签

代码语言:javascript
复制
# 设定网址
url = "https://k5l.cn"

# 获取网页html 
r = req.get(url)

# 导入 html 进入 beautifulsoup4
soup = BeautifulSoup(r.text, features="html.parser")

# 获取 title 标签
print(soup.title)

Beautifulsoup4 获取 title 标签内部文字

代码语言:javascript
复制
# 设定网址
url = "https://k5l.cn/"

# 获取网页html 
r = req.get(url)

# 导入 html 进入 beautifulsoup4
soup = BeautifulSoup(r.text, features="html.parser")

# 获取 title 标签内部文字
print(soup.title.text)

Beautifulsoup4 获取网页第一个超链接

代码语言:javascript
复制
# 设定网址
url = "https://k5l.cn/"

# 获取网页html 
r = req.get(url)

# 导入 html 进入 beautifulsoup4
soup = BeautifulSoup(r.text, features="html.parser")

# 获取网页第一个超链接
print(soup.a)

Beautifulsoup4 获取网页第一个超链接的属性

代码语言:javascript
复制
# 设定网址
url = "https://k5l.cn/"

# 获取网页html 
r = req.get(url)

# 导入 html 进入 beautifulsoup4
soup = BeautifulSoup(r.text, features="html.parser")

# 获取网页第一个超链接的属性
print(soup.a.attrs)
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Beautifulsoup4 导入模组
  • Beautifulsoup4 美化 HTML 代码
  • Beautifulsoup4 获取 title 标签
  • Beautifulsoup4 获取 title 标签内部文字
  • Beautifulsoup4 获取网页第一个超链接
  • Beautifulsoup4 获取网页第一个超链接的属性
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档