我正在用Python编写一个web抓取应用程序。我正在抓取的网站有www.someurl.com/getPage?id=x表单的urls,其中x是标识页面的编号。现在,我正在使用urlretrieve下载所有页面for i in range(1,1001):
urlretrieve('http://someurl.com/getPage因为,在这里,我阻塞了脚本,等待页面</
我正在尝试从通常包含多个页面的网页中提取特定数据。虽然我能够在第一页打印出我需要的所有信息,但我不能在其他页面上这样做。我在互联网上搜索解决方案,发现大多数解决方案都是通过连接一个链接页面和一个数字来遍历每个页面的。 然而,我在一个网站上工作,在这个网站上,当你导航到不同的页面时,链接页面不会改变。因此,我很难确定是哪个属性导致URL重定向到第二个页面,因为没有显示可点击的链接。iZEpOT"})
for n, i in enumerate