with requests.Session() as s:是在站点内部维护cookies的内容,这就是允许一致刮取的内容。在此基础上,BeautifulSoup现在可以从accounts站点中获取和解析HTML。在这种情况下,"html.parser"和"lxml"都是兼容的。如果iframe中有HTML,那么它是否可以仅使用requests进行抓取和解析是值得怀疑的,所以我建议最好使用selenium。soup
我正在尝试使用BeautifulSoup来解析包含一篇韩国新闻文章的iframe,并打印出文章中每个单独的正文段落。因为韩语段落内容位于其自己的td标记中的p标记中,并且类id为"tlTD",所以我想我可以使用该类名遍历每个td并打印p标记,如下所示: link ="https://gloss.dliflc.edu/我尝试使用lambda表达式和正则表达式来使类名更具排他性,但我总是得到相同的结果。我可以理解为