首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >美丽的汤是在任意位置插入随机标签

美丽的汤是在任意位置插入随机标签
EN

Stack Overflow用户
提问于 2021-03-18 00:13:48
回答 1查看 18关注 0票数 0

示例如下:

代码语言:javascript
运行
复制
>>> from bs4 import BeautifulSoup as BS
>>> soup = BS('<p><a class="glossary-anchor" name="AB_testing"></a><h2 class="hide-from-toc" data-text=" A/B testing" id="ab-testing"> A/B testing</h2></p>')
>>> soup
<html><head></head><body><p><a class="glossary-anchor" name="AB_testing"></a></p><h2 class="hide-from-toc" data-text=" A/B testing" id="ab-testing"> A/B testing</h2><p></p></body></html>
>>> 

如果您仔细观察,在第一个</a>关闭之后,有一个新添加的</p>标记。最后,它还定义了自己的不带文本的p标记。

我试着定义我自己的html,head和body标签。这似乎是非常不恰当的行为,我不知道该如何查找或查找什么。

EN

回答 1

Stack Overflow用户

发布于 2021-03-18 00:26:39

好了,我找到了一个解决方案

解析器一定是不一样的。

我认为缺省值是'html.parser‘,但当我显式地将其添加到soup构建器中时,它可以正常工作。

soup = BS('<p><a class="glossary-anchor" name="AB_testing"></a><h2 class="hide-from-toc" data-text=" A/B testing" id="ab-testing"> A/B testing</h2></p>', 'html.parser')

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/66676984

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档