我正在使用Python3.8.3,并尝试从附加的文本文件中删除标签
我想提取3个列表-标题,出版日期和文章的正文,并删除标签。在下面的代码中,我已经能够从标题和发布日期中删除标签。任何帮助提取这部分文本的人都将不胜感激!文章文本是非英语脚本,但所有的html标记都是英语的。#opening text file which contains newspaper article information scraped off website using beautifulsoup
“我试图通过BeautifulSoup找到合适的标签,但它似乎是使用Javascript呈现的?我尝试查看network选项卡,以查看是否有一些json数据用于填充菜单。在这种情况下,我是不是被迫使用了一些硒?硒是重量级的,而且速度很慢。requests.get(url) f.write(response.content)
soup = B