我尝试使用select与BeautifulSoup一起选择标签,但如果根标签是BeautifulSoup对象的一部分,BeautifulSoup似乎会选择根标签,但如果根标签只在tag对象中,则不会。>>> from bs4 import BeautifulSoup>>> a = soup.new_tag("a")
>>>
我正在试着从html文件中删除所有的脚本标签。问题是html文件在某些情况下没有表格行的开始标签(在行尾只有标签),因为它们是不完整的,所以漂亮汤似乎正在删除它们。结果,这会打乱表格的格式。有没有其他方法可以在不弄乱格式的情况下删除这些脚本标记?import os from bs4 import BeautifulSoup
root_dir = os.path.join(Path().absoluteiterdir(