我自动地将HTML页面的内容翻译成不同的语言,所以我必须从不同的HTML页面中提取所有的文本节点,这些HTML页面有时写得很糟糕(我无法编辑这些HTML)。通过使用BeautifulSoup,我可以很容易地提取这些文本并将其替换为翻译,但是当我在这些操作之后显示HTML时: html = BeautifulSoup(source_html) --有时会因为BeautifulSoup自动关闭标记而中断
我在页面中包含了一个header.html (而不是.xhtml),但是当我预览页面时,它给出了错误"XML Error: no element found“。我知道这是标签没有正确关闭的问题,但由于我的头页是一个html文件,而不是xhtml文件,它不应该必须关闭标签,我说的对吗?如果我确实关闭了我的header.html中的所有元标签,我的页面工作得很好,但我希望知道如果我在jsf2中包含它们,它是否必须正确地关