我正在使用CSS选择器从网上刮数据与美丽汤4模块。requests.get('https://dailystoic.com/epictetus/')
soup = bs4.BeautifulSoup(res.text, 'html.parsercontent and store in variableprint(content)
我要超链接中的html</e
如何在lxml.html.clean.Cleaner模块中设置Unicode字符串编码声明?我正在寻找一个网站的纯文本阅读,并在过去使用lxml作为一种方式来做这件事,刮掉的html和javascript。对于某些页面,我开始收到一些关于编码的奇怪错误,但是不知道如何正确地设置这个参数。('\t',' ').replace('\n',' ').replace('\r',' ')... l