Python web抓取脚本在循环期间重新开始_Python脚本- Web抓取_在web抓取中循环 - 腾讯云开发者社区

python

下面是代码，当我运行脚本时，它从第一页开始运行。其目的是从每个页面获取帖子标题、日期和正文，然后单击每个页面底部的next再次启动该过程。

浏览 30提问于2020-11-11得票数 0

2回答

Django应用程序初始化过程

python、django、deployment、development-environment

在服务器启动期间，需要执行一组功能。不管路径如何，不管是"/“、"/blog/、”/blog/post。出于开发目的，我希望这个脚本每次运行python manage.py runserver时都能运行，出于生产目的，我希望这个脚本在部署期间运行。有人知道怎么做吗？我的脚本正在抓取数据，并使用python和它的一些库调用Facebook的Graph

浏览 5提问于2015-07-19得票数 0

回答已采纳

2回答

我正在尝试从有经验的人那里获取更多的信息，一般来说，我正在使用Python库进行web抓取。与此同时，我注意到一些人正在使用simple Bash，并使用wget, curl, sed, grep, awk等命令进行web抓取。与使用Python库进行web抓取相比，这些命令在脚本编写方面似乎要干净得多。你对此有什么看法？您认为使用python库比使用Bash有什么优势吗？或者甚至使用Py

浏览 1提问于2017-03-03得票数 0

1回答

Python脚本- Web抓取

html、python-3.x、web-scraping

我正在做一个脚本，从一个网址(http://www.pmo.cz/portal/nadrze/cz/mereni_1_mes.htm)获取一些数据。(我刚刚开始使用python，所以如果这只是另一个重复的问题，我很抱歉) 我尝试了.rstrip函数，尝试使用for循环删除它，尝试将其转换为另一种数据类型，但似乎什么都不起作用:( 我遵循了一个教程(

浏览 14提问于2020-01-26得票数 1

回答已采纳

2回答

如何创建一个调用python抓取脚本的web服务？

python、python-2.7、web-scraping、bottle

我是python初学者，我需要一些帮助来创建一个web服务，该服务调用python抓取脚本(一门课程的任务)。其想法是首先创建web服务，然后使用服务器上的web抓取脚本。感谢哥伦比亚的帮助和问候！

浏览 3提问于2015-12-16得票数 0

回答已采纳

1回答

如何简化/自动化数据输入？

database、web

我希望创建一个网站周围的工具，从不同的网站插入到我的表单信息。我想取消/简化数据输入。有谁知道完成这项任务的好方法吗？

浏览 0提问于2016-04-19得票数 1

1回答

为什么selenium不能在Firefox上工作，但是在重新安装之后却可以无缝地工作呢？

python、selenium、firefox、geckodriver

因此，我从“用Python自动完成无聊的事情”开始，现在学习第11章，即Web抓取。在此期间，我很难让selenium与Firefox协同工作。该版本的详细内容如下：Firefox: 81.0 (64 bit) (Latest at the time of writing)Geckodriver: 0.27from selenium im

浏览 1提问于2020-09-27得票数 1

回答已采纳

5回答

如何从其他网站获取数据？

python、database、parsing、web-scraping

我听说Python使用解析器可以做到这一点，我只是想知道我应该走哪条路，应该使用哪种语言？

浏览 1提问于2013-06-14得票数 4

1回答

如何在heroku中的rails应用程序中运行python脚本？

python、ruby-on-rails、heroku、web-scraping、scrapy

我在heroku中托管了一个rails应用程序。我还用python中的scrapy编写了一个web刮刀。我需要从heroku中的rails应用程序中运行python脚本，我将用一个例子来解释。例:用户将输入url在我的rails app.Then中进行抓取，rails应用程序将控制权交给python来抓取数据，该脚本以json object.Then的形式发送响应，我们必须在web应用程序中呈现

浏览 2提问于2013-10-24得票数 3

回答已采纳

2回答

如何终止python中的线程以跳出循环，然后再继续循环？

python、multithreading、multiprocessing、python-multithreading

我用python编写了一段代码用于抓取。我有一个列表的网址，需要刮，但过了一段时间后，脚本失去了阅读网页的循环。所以我需要设置一个固定的时间，然后脚本应该从循环中出来，开始阅读下一个网页。for link in list_of_links: <some code to read webpage>脚本

浏览 1提问于2014-04-24得票数 0

回答已采纳

2回答

使用Python从异常页面再次爬行

python、for-loop、try-catch、except

我使用for循环来抓取网页。然而，当我抓取一些页面时，我遇到了ip请求限制错误。当我每隔20页爬行一次时，我曾尝试让python休眠几秒钟，然而，错误仍然存在。我可以在python休眠60秒后重新开始爬行。问题是，每次出现异常时，我都会丢失一页信息。看起来python使用try-except方法跳过了异常页面。

浏览 3提问于2012-05-20得票数 0

3回答

抓取urls的抓取顺序

python、scrapy

我有个关于scrapy和python的问题。我有几个链接。我使用循环在一个脚本中抓取每个脚本中的数据。但抓取数据的顺序是随机的，或者至少与链接不匹配。喜欢:抓取的网址，data1，data2，data3。Data 1，data2，data3 =>这是可以的，因为它来自一个循环，但是我如何添加到循环的当前url，或者我可以设置链接列表的顺序？就像列表中的第一个被抓取为第一个，第二个被抓取

浏览 0提问于2018-04-18得票数 0

3回答

在循环中迭代时，在循环中访问MySQL的效率是高还是低？

php、mysql、loops、web-scraping

我正在编写一个PHP脚本来从web上抓取数据。最终，我想要把所有抓取的数据很好地塞进mysql数据库中并进行格式化。但是，由于PHP脚本中有多个循环和数组需要迭代，我的直觉是，为了速度和效率，最好不要保持对mysql数据库的循环访问(在每次循环时插入数据)，而是将数据存储在PHP中的临时数组中，然后仅在脚本结束时将数组一次性转储到

浏览 2提问于2012-05-12得票数 1

回答已采纳

1回答

如何在python中插入执行两条语句之间的1秒时间间隔

python、centos

我在python2.7web抓取程序中有一个" FOR“循环，我将在FOR循环的末尾插入1秒的时间差。我怎么能这么做？谢谢。

浏览 4提问于2015-07-22得票数 0

回答已采纳

1回答

有没有办法在App engine上和我的Flask网页一起运行脚本？

python、google-app-engine、flask、google-cloud-platform

我最近建立并运行了我的Flask网站，它使用了从其他几个网站上抓取的数据，并在我自己的网站上展示。我的问题是，我不知道如何在部署期间运行web抓取脚本。

浏览 12提问于2020-09-24得票数 0

回答已采纳

1回答

从网络抓取开始

javascript、python、web-scraping

首先，我想让您知道，我对html和css非常陌生，目前我还不知道如何使用Java脚本。我在看关于如何制作网络刮刀的视频，我有一些问题：我看到了很多教程在python中进行web抓取，因为我非常了解python，所以我问自己，什么更适合web抓取？Python还是Java脚本，我应该使用哪一个？我可以将python程序与html连接起来吗？我需要使用网站抓取一个网站，我正在尝试做一

浏览 1提问于2019-12-31得票数 0

回答已采纳

1回答

如何背靠背运行多个Selenium测试

python、selenium

我正在尝试使用Selenium和Python执行动态web抓取。我正在尝试抓取的网站有一个输入，大约600个位置可以选择。每个位置都有不同的设施。我想要抓取设施的名称以及每个位置的地址。我使用Pandas导入这些位置，然后尝试执行for循环，遍历每个位置，在输入中输入位置，然后抓取下面输出的设施。但是，我的for循环并没有像预期的那样工作，所以每次我运行脚本时，Selenium驱动程序都会打开，并且我会按照第一个位

浏览 16提问于2019-07-10得票数 1

1回答

在R for循环中延迟抓取几分钟

r、xml、sleep、rcurl

我正在尝试抓取一个网站，它不允许我抓取超过9页，有没有办法在9页后停止循环，中断一到两分钟，然后重新开始抓取？

浏览 11提问于2020-10-05得票数 0

回答已采纳

1回答

Web抓取循环python问题

python、web-scraping

我是一名python新手，想知道是否有人能够用下面的webscraping脚本指出我哪里出了问题。我试图递归地循环遍历匹配列表，为每个匹配提取一个累积值(度量)。

浏览 40提问于2018-09-16得票数 2

1回答

Python web抓取页面循环

python、python-3.x、web-scraping

我已经写了一个抓取器，它成功地从网站的第一页抓取了我需要的一切。但是，我想不出如何让它在不同的页面中循环。

浏览 0提问于2016-12-09得票数 3

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云