问如何在不指定标签和删除垃圾的情况下获得在python中标识的url内容？
EN

Stack Overflow用户

提问于 2018-06-27 14:45:14

回答 1查看 36关注 0票数 -2

如何在不指定标记和删除垃圾的情况下获得在python中标识的url内容？

我知道通常的方法，从urlopen获取数据，然后使用BeautifulSoup来识别内容的标签。我真正想知道的是，有没有什么泛型方法或库可以在不指定标记的情况下做到这一点。

发布于 2018-06-27 15:03:30

如果要从HTML中提取文本：

from bs4 import BeautifulSoup 
soup = BeautifulSoup(html) 
text = soup.get_text()

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/51056176

复制

相似问题

问如何在不指定标签和删除垃圾的情况下获得在python中标识的url内容？EN