Python:在BeautiflSoup中，如何从这样的标记中获取文本

在BeautifulSoup中，可以使用.text属性来获取标记中的文本内容。

例如，假设有以下HTML标记：

<p>This is a paragraph.</p>

可以使用以下代码来获取该标记中的文本内容：

from bs4 import BeautifulSoup

html = '<p>This is a paragraph.</p>'
soup = BeautifulSoup(html, 'html.parser')
text = soup.p.text
print(text)

输出结果为：

This is a paragraph.

在这个例子中，我们首先导入了BeautifulSoup库，并将HTML标记传递给BeautifulSoup对象进行解析。然后，我们使用.p来选择<p>标记，并使用.text属性来获取该标记中的文本内容。最后，我们打印出文本内容。

需要注意的是，如果标记中包含了其他标记，.text属性将会返回所有文本内容的合并结果。如果只想获取直接子节点的文本内容，可以使用.string属性。

希望这个答案对你有帮助！如果你对其他问题有疑问，欢迎继续提问。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云