文章/答案/技术大牛

发布

聊聊Python中的Bleach库，让你的网站内容更安全

文章来源：企鹅号 - 卓希小哥哥

大家好啊！今天咱们来聊一个特别实用的Python库 - Bleach。它就像是一个内容安全卫士，主要用来清理和过滤HTML内容。如果你正在开发网站，特别是需要处理用户输入的富文本内容，那这个库简直就是你的得力助手！

安装指南

安装 Bleach 特别简单，只需要一行命令：

pip install bleach

安装完成后，咱们可以用下面的代码验证一下：

import bleach

print(bleach.__version__)

如果能正常显示版本号，就说明安装成功啦！

小提示：建议Python版本 >= 3.7

基础使用

先来看看最基本的用法。Bleach主要有三个核心功能：清理(clean)、消毒(sanitize)和链接处理。

1. 基本清理

import bleach

# 包含潜在危险HTML的文本

html_text = '这是一个<script>alert("危险代码!")</script>段落<a href="http://example.com">带链接</a>'

# 清理HTML

clean_text = bleach.clean(html_text)

print(clean_text)

运行结果：

这是一个段落<a href="http://example.com">带链接</a>

看到了吗？那个可能执行恶意JavaScript的标签被自动删除了！

2. 自定义允许的标签

import bleach

html_text = '粗体文本和斜体文本'

# 只允许和标签

clean_text = bleach.clean(html_text, tags=['p', 'b'])

print(clean_text)

运行结果：

实战案例

案例1：处理用户评论

假设我们在开发一个博客系统，需要处理用户提交的评论：

import bleach

def process_comment(user_comment):

# 定义允许的标签和属性

allowed_tags = ['p', 'b', 'i', 'u', 'a']

allowed_attributes = {

'a': ['href', 'title']

}

# 清理评论内容

clean_comment = bleach.clean(

user_comment,

tags=allowed_tags,

attributes=allowed_attributes,

strip=True

)

return clean_comment

# 测试一下

user_input = '''

'''

safe_comment = process_comment(user_input)

print("处理后的评论：")

print(safe_comment)

运行结果：

普通链接

案例2：链接处理器

有时我们需要自动处理文本中的URL，让它们变成可点击的链接：

import bleach

from bleach.linkifier import LinkifyFilter

def auto_link_text(text):

# 自定义链接处理

def link_callback(attrs, new=False):

href = attrs.get((None, 'href'), '')

# 给所有链接添加target="_blank"和rel="nofollow"

attrs[(None, 'target')] = '_blank'

attrs[(None, 'rel')] = 'nofollow'

return attrs

# 处理文本中的URL

linked_text = bleach.linkify(

text,

callbacks=[link_callback],

skip_tags=['pre']

)

return linked_text

# 测试一下

text = "快来看看这个网站：https://python.org 真不错！"

result = auto_link_text(text)

print(result)

小结

Bleach真的是处理HTML内容安全的好帮手！它主要能帮我们：

清理不安全的HTML标签和属性

自定义允许的标签和属性

自动处理文本中的URL

要深入了解更多功能，建议看看Bleach官方文档。

记住一点：在处理用户输入时，安全永远是第一位的！Bleach能帮你省不少心。

有啥问题随时问我哈！咱们下篇文章见！

发表于: 2025-01-132025-01-13 19:17:02
原文链接：https://page.om.qq.com/page/OQcpXeUdG87_A4xfE-hTOj-A0
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

聊聊Python中的Bleach库，让你的网站内容更安全

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐