如何使用Python循环抓取不同的页面_如何使用python抓取aspx呈现的页面_Python :如果满足特定条件，如何使用不同的抓取页面重复“bs4”循环？ - 腾讯云开发者社区

python、beautifulsoup

我想从网站上抓取数据。这个表扩展到多个页面上，但是url没有像page=3这样的东西，所以我不能遍历各个页面来获取数据。有没有其他方法可以像这样抓取数据，而不会在不同的页面上循环？如何从python访问不同的页面来抓取数据？

浏览 19提问于2018-03-04得票数 0

2回答

如何使用Python循环抓取不同的页面

python、web-scraping、beautifulsoup、automation、stat

因此，我使用这段代码的目的是提取有关我的NFL球队中的一名新秀的信息。我想将他的表现与上赛季排名前十的球员进行比较，当时他们在第一个赛季打了超过10场比赛。为此，我引用了《迈向数据科学》中的一篇文章作为参考，其中他们解释了如何抓取NFL数据。我如何改进它来创建一个循环？我已经尝试了一些东西，但对于所有这些想法，它们要么工作得不好，要么超出了我成功执行的能力范围。我

浏览 36提问于2021-09-22得票数 0

回答已采纳

1回答

硕士研究生项目未研究数据的数据挖掘

dataset、data-mining、data、research、scraping

因此，我必须开始思考我在数据科学硕士学位(面向商业，尽管我可以选择任何不相关的领域)的最后项目的主题，其中一个要求是挖掘和使用尚未在学术研究环境中进行分析的数据。我倾向于避免典型的从twitter或其他常见的信息资源中刮取数据。如果您能给我一些关于如何找到一个可访问的数据源的想法或指导，我将非常感激，这也不需要太多的时间来获取信息。非常感谢你的帮助！

浏览 0提问于2022-06-17得票数 0

回答已采纳

3回答

如何从网站拉取信息到我的项目中？

python、html、module

我有一个问题，那就是从网站获取信息到我的python项目中(当项目正在运行时)。我还没有写过任何代码，因为我是这种编程的初学者。我想问你，我需要哪些模块以及如何使用它们，如果你们中的一些人可以，我将感谢一些代码的例子。

浏览 1提问于2020-09-18得票数 0

1回答

通过Scrapy或Excel查询搜索的Python via抓取？

python、excel、web-scraping、scrapy

我的问题与发现通过Scrapy执行Python Web抓取的总体效率有关，而不是简单地通过Microsoft Excel为特定任务执行Web查询搜索。我想做的是自动从NFL网站上提取数据。我知道我可以简单地将信息复制并粘贴到Excel电子表格上，但这不是我想要做的。我正在尝试发现一种自动化过程的方法，这样我就不需要自己手动完成了。当涉及到通过Scrapy的Python Webscrape时，挑战是开发代码来获得我正在寻找的<

浏览 2提问于2018-10-18得票数 1

3回答

抓取urls的抓取顺序

python、scrapy

我有个关于scrapy和python的问题。我有几个链接。我使用循环在一个脚本中抓取每个脚本中的数据。但抓取数据的顺序是随机的，或者至少与链接不匹配。所以我不能将每个子页面的url与输出的数据进行匹配。喜欢:抓取的网址，data1，data2，data3。Data 1，data2，data3 =>这是可以的，因为它来自一个循环</

浏览 0提问于2018-04-18得票数 0

1回答

我的for循环在我的gamestop的刮板上没有被读取

python、python-3.x、web-scraping、beautifulsoup

我无法读取他的for循环并获取项目列表，它根本不打印任何内容，并跳过整个循环导入请求import re from bs4 import BeautifulSoup maxPages = 10 maxPages

浏览 0提问于2018-08-02得票数 0

1回答

BeautifulSoup在解析带有POST表单操作的html时出现问题

python、beautifulsoup、urllib2、mechanize

点击此链接使用urllib2登录：<div id="gridContainer"

浏览 24提问于2017-02-26得票数 0

1回答

使用curl抓取大页面

php、curl、screen-scraping

我正在尝试从一个流行的新闻网站上收集评论，以便使用curl进行学术研究。对于评论少于300条的文章，它可以很好地工作，但在此之后，它就会陷入困境。$html = curl_exec($handle);echo $html; //just to see what's been scraped但是这个只返回了36条评论，尽管总共有700+：为什么它在拥有大量评论的文章中苦苦挣扎？

浏览 2提问于2012-08-23得票数 0

1回答

Python Webscraping抓取循环页面

python、loops、beautifulsoup

我最近开始了我的第一个数据科学项目。我想分析具体的工作待遇，因此需要从一个工作门户收集一些数据。但是，一旦我试图遍历页面Projec

浏览 6提问于2022-02-10得票数 1

回答已采纳

1回答

Python web抓取页面循环

python、python-3.x、web-scraping

我已经写了一个抓取器，它成功地从网站的第一页抓取了我需要的一切。但是，我想不出如何让它在不同的页面中循环。url只是简单地递增，就像这样BLAH/3 + 'page=x‘ 我学习编程的时间并不长，所以任何建议都将不胜感激！

浏览 0提问于2016-12-09得票数 3

回答已采纳

2回答

使用Python从异常页面再次爬行

python、for-loop、try-catch、except

我使用for循环来抓取网页。然而，当我抓取一些页面时，我遇到了ip请求限制错误。当我每隔20页爬行一次时，我曾尝试让python休眠几秒钟，然而，错误仍然存在。我可以在python休眠60秒后重新开始爬行。问题是，每次出现异常时，我都会丢失一页信息。看起来python使用try-except方法跳过了异常页面。我想知道最好的方法是重新启动，从遇到异常的页面再次爬

浏览 3提问于2012-05-20得票数 0

1回答

如何用python制作网站图？

python、graph、python-2.7

我想做一个python脚本作为输入主网址，例如：，然后它递归地遍历所有页面，并制作站点及其子页面的所有页面(节点)的有向图，当且仅当在节点a(页面a)到节点b(页面b)中存在链接时才有边缘。我假设有这样的东西，但我在谷歌上没有找到...如果有任何想法，也许可以使用wget who，这是我想听到的其他想法。

浏览 1提问于2012-05-23得票数 1

回答已采纳

2回答

如何从外部网站重建图像预览？

ruby-on-rails、image、facebook、url、preview

类似于Facebook的用户界面，我正在尝试从外部链接的网站生成预览图像。因此，当用户输入他正在链接的url时，UI将默认地扫描该站点的img并抓取预览拇指。非常感谢！

浏览 1提问于2011-01-02得票数 5

回答已采纳

1回答

使用Selenium和Scrapy通过onclick抓取显示的数据

python、selenium、scrapy

我使用Scrapy用python编写了一个脚本，以便使用身份验证从网站上抓取数据。我正在抓取的页面真的很痛苦，因为主要是由javascript和AJAX请求组成的。页面的所有主体都放在允许使用submit按钮更改页面的<form>中。URL不会改变(而且是一个.aspx)。我已经成功地从第一页抓取了所需的所有数据，然后使用以下代码更改

浏览 38提问于2019-02-21得票数 0

1回答

触发AJAX时获取JSON文件

ajax、json、web-crawler

我正在编写一个爬虫从一个使用AJAX的网站获取内容。在页面底部有一个“显示更多”按钮，我最初的方法是使用Selenium.PhantomJS来伪装成一个web浏览器，但它在一些网站上可以工作，有些不能。我想知道是否有什么方法可以直接获取AJAX操作的底层JSON文件。请告诉我一些细节，谢谢。顺便说一下，我使用的是Python。

浏览 0提问于2014-07-23得票数 0

1回答

Web抓取-如何提取URL中的链接类型？

python、web-scraping

我有一个URL列表，我必须从每个URL中提取链接，并为每个链接提取该链接的类型(表单，跟踪码，同一网站上的另一个页面，外部网站等)。我的问题是:您认为这在Python库中可行吗？

浏览 47提问于2019-06-20得票数 0

1回答

在木星笔记本上使用python请求和异步抓取JavaScript页面

python-3.x、asynchronous、jupyter-notebook、python-asyncio

--这与大不相同，因为这个问题甚至不使用请求进行抓取，而是只用于会话和获取页面内容。我对美汤的使用方式也是如此。我也尝试过。但他们也没有解释如何有效地使用请求获取JavaScript内容。我试图从JavaScript代码呈现的网页中抓取信息。我在木星笔记本中使用requests模块。r = await asession.get('http://python-req

浏览 3提问于2019-10-29得票数 1

1回答

从html页面不显示数据的url读取数据

beautifulsoup、python-3.5

r = s.get(link) print(soup.prettify()) 但是我看不到网页的内容如何提取它们？

浏览 1提问于2020-02-05得票数 0

1回答

尝试使用Python的Scrapy包，但它总是在不应该返回的地方返回空值

python、python-3.x、web、scrapy、screen-scraping

我的程序在不应该返回空值的地方一直返回空值，然后就崩溃了。我制作了我的程序的一个简化版本： #-------------------------------------------------------------------------------import refrom math import ceil os.chdir("C:/Users/Owner/Desktop&#

浏览 17提问于2020-03-27得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

从多个页面中抓取表格

如何使用Python循环抓取不同的页面

硕士研究生项目未研究数据的数据挖掘

如何从网站拉取信息到我的项目中？

通过Scrapy或Excel查询搜索的Python via抓取？

抓取urls的抓取顺序

我的for循环在我的gamestop的刮板上没有被读取

BeautifulSoup在解析带有POST表单操作的html时出现问题

使用curl抓取大页面

Python Webscraping抓取循环页面

Python web抓取页面循环

使用Python从异常页面再次爬行

如何用python制作网站图？

如何从外部网站重建图像预览？

使用Selenium和Scrapy通过onclick抓取显示的数据

触发AJAX时获取JSON文件

Web抓取-如何提取URL中的链接类型？

在木星笔记本上使用python请求和异步抓取JavaScript页面

从html页面不显示数据的url读取数据

尝试使用Python的Scrapy包，但它总是在不应该返回的地方返回空值

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐