sp=0‘,它出现在整个页面中。我不确定如何使用soup.find_all方法来完成此操作。我需要的字符串总是出现在‘’旁边
这就是我所想的(如下所示),但显然我的参数是错误的。如何格式化find_all方法以在整个页面中返回‘/r/8291696a3726?sp=0’字符串?for divsec in soup.find_<
我正在尝试找到一种在BS4中抓取多个页面的有效方法。我能够轻松地抓取第一页,并获得我需要的所有数据,但不幸的是,并不是所有的数据都在上面。还有另外两个页面需要抓取,而不是硬编码并更改第二个和第三个页面的URL,我想知道是否有更好的方法使用BS4在Python中实现这一点。唯一需要更改的部分是page=1到相应的页码(1、2、3)。import csv from bs4</em