For循环不会抓取所有项，只需要一个_创建一个for循环来计算pi的所有项_Foreach循环不会超出第一个面板项的范围 - 腾讯云开发者社区

xpath、web-scraping、scrapy

我试图在网页上抓取大约20篇文章，但由于某种原因，爬行器只能找到第一篇文章所需的信息。我如何让它抓取页面上的每一篇文章？我已经多次尝试更改xpath，但我认为我对此还太陌生，无法确定问题出在哪里。当我从for循环中取出所有路径时，它会很好地删除所有内容，但它的格式不允许我将数据传输到csv文件。

浏览 20提问于2020-07-22得票数 0

回答已采纳

2回答

调用另一个存储过程的存储过程长时间挂起

sql-server、loops、stored-procedures

我有一个存储过程，可以为特定的客户获得我想要的东西。它返回了20行... 我需要做的是为20个客户调用这个存储过程，然后返回整个结果集。

浏览 0提问于2012-10-21得票数 2

3回答

如何访问Scrapy项目管道中的所有抓取项目？

python、scrapy

我有一个项目，它有一个排名字段，必须从分析其他项目类构建。我不想使用数据库或其他后端来存储它们-我只需要访问所有当前抓取的项，并对它们执行一些itertools魔术-在爬虫完成之后，但在我们导出数据之前，我如何做到这一点(这样排名字段就不会为空)？

浏览 2提问于2012-10-07得票数 2

4回答

电影“社交网络”( Social )中有一个整洁的序列，其中角色写了一个perl脚本，从校园里的联谊会网络服务器抓取图像。他的目标是为每个联谊会的每一名成员拍摄一张照片，并尽可能少地错过会员。通常情况下，这只需要他从公共目录或其他小循环中抓取它，就像返回所有成员的空搜索一样，但是他描述了一个非常有趣的设置，从来没有给出解决方案。一个联谊会的网站允许搜索并返回匹配成员的图片。但是，如果搜索返回超过20个匹配项，则<e

浏览 5提问于2011-04-05得票数 4

回答已采纳

3回答

C# SQL Server -更高效地处理多个数据库访问或多个数据循环？

c#、sql、performance、processing-efficiency

在我的应用程序的一部分中，我必须获取满足条件的表的最后一个ID，例如：因此，我可以抓取整个表并循环查找Num = 2，也可以从Num = 2的表中抓取数据。在后者中，我知道最后一项将是MAX ID。无论哪种方式，我都必须在50 times...so左右做这件事，这样做会不会更有效地抓取所有数据，并在数据列表中循环查找特定条件…… 或者，根据我知道列表中最

浏览 3提问于2012-05-31得票数 0

回答已采纳

1回答

使用selenium Python迭代搜索多个搜索词

python、selenium

我正试着在LexisNexis上搜索一下，然后抓取结果。我需要从所有页面中抓取结果，所以我希望selenium执行搜索，抓取数据，然后单击next并重新执行。此外，我希望它对多个术语进行这种搜索。

浏览 11提问于2018-09-06得票数 0

1回答

如何仅使用CSS选择无序列表的父级？

html、css、css-selectors

"#">Sub Item B</a></li> </li> </ul> 我只需要抓取第一项来改变它的我尝试过这样的方法: ul li a-不起作用，因为它会抓住第2项

浏览 3提问于2017-12-19得票数 1

回答已采纳

1回答

读取目录中没有循环的所有文件

python

我已经找了好几天了，想知道有没有办法不用循环就能读取python目录中的所有文件。我之所以问这个问题，是因为当我去写文件时，它会再次遍历循环，覆盖我的所有信息，或者当我只需要抓取一个文件时，它就会加倍。

浏览 2提问于2022-06-13得票数 2

2回答

Javascript document.querySelectorAll()不适用于无限滚动

javascript、web-scraping、puppeteer

我正在尝试建立一个简单的网络抓取工具。我正在尝试的数据有一个无限的滚动。

浏览 0提问于2019-12-04得票数 0

2回答

使用python和sqlite进行Web抓取。如何有效地存储抓取的数据？

python、sqlite、web-scraping

我想定期抓取一些特定的网页(例如每小时)。我想用python来做这件事。抓取的结果应该插入到一个SQLite表中。新的信息将被抓取，但“旧的”信息也将再次被抓取，因为python脚本将每小时运行一次。更准确地说，我想要抓取一个体育结果页面，其中随着锦标赛的进行，越来越多的比赛结果会发布在同一页面上。因此，对于每一次新的抓取，我只需要将新的结果输入到SQLite表中，因为旧的结果在一个小时前(甚至更早)已经被

浏览 0提问于2013-04-17得票数 5

回答已采纳

1回答

卷曲多爬行问题

php、curl

我们有一个爬行引擎，每月可以满足大约500,000名游客的需求。我们现在使用curl来获取网页。我们最近使用了多个exec和curl来同时抓取页面。我们将其设置为同时抓取20个页面。现在，在获取网页的过程中，curl将完全停止，直到所有20个页面都被获取，然后才会移动到下一个20个页面。这就像如果一个页面获取速度很慢，那么curl将等待该页面加载，直到它移动到下一个循环，在下一个循环中，我将获取下20个页面。有没有

浏览 0提问于2012-01-16得票数 1

回答已采纳

1回答

使用PHP & IMAP获取尚未抓取的电子邮件

php、sql、email、imap

这是一个更多关于最佳实践的问题--我希望这样可以。imap_search($inbox, 'SUBJECT "Ticket #" SINCE "'.date("Y-m-d").'"'); 但这只需要<

浏览 0提问于2013-12-10得票数 0

回答已采纳

4回答

从数组中随机获取3项，其中第3项可以是“餐厅”，但不必是

javascript、arrays、loops

我需要从数组中随机抓取三个项目。只有一件物品可以是“餐厅”，而餐馆只能排在第三位。el 1 - restaurant = falseel 3 - restaurant = true} 我最初的想法是，我只

浏览 4提问于2020-02-20得票数 0

回答已采纳

2回答

在foreach循环中创建数组的一个实例

php、arrays、pdo、foreach、unset

我在这里有一个独特的情况，我不确定这是否是正确的方式；我对建议持开放态度。 } echo $e->getMessage();} 问题是，由于函数在f

浏览 4提问于2013-04-26得票数 0

回答已采纳

1回答

Worker在从queue.Queue读取第一个项目时停止

python

target=worker) t.start() q.put(url) q.join() 我希望它能打印出所有的URL，但只打印出了第一个URL。我以为worker会获取第一个项目，将其打印出来，然后返回获取下一个项目。在本例中，我只创建了一个线程，但是一旦我理解了发生了什么，就可以添加更多的线程。为什么它只打印第一个URL？

浏览 12提问于2019-02-20得票数 0

回答已采纳

1回答

Node.js后台处理

node.js、azure

我是node.js的新手，所以请原谅一个可能是天真的问题:)我的问题是，设置在node中编写的非UI作业的最佳方式是什么？我创建的任务用于基于Azure队列抓取一些web内容(队列消息告诉作业要抓取哪些内容)。我在node周围看到的所有示例都更多地基于UI和请求，使用http.createServer并侦听特定的端口。虽然我可以做到这一点，但这似乎并不正确，似乎我只需要创建某种javascript setInterval循环(或类似的循环)来不断查看我的队列。任何能将我

浏览 0提问于2012-01-30得票数 2

回答已采纳

1回答

Jekyll是否会受到Shopify液体规格所宣布的50项循环上限的影响？

for-loop、jekyll、liquid、limits

用于循环标签的Shopify液体{% for %}声明如下： .{% for var in (1..100) %} {{ var }} .{% endfor %} 因此，至少在Jekyll中的一

浏览 3提问于2018-08-14得票数 0

回答已采纳

1回答

如何在ordered+persisted集合中更改订单？

java、google-app-engine、collections、google-cloud-datastore

我只需要更改(先前持久化的)有序集合中的项的顺序...这肯定是最愚蠢的问题了，但是我已经没有主意了，我已经被困在这里两天了。我发誓我谷歌过了。:(

浏览 1提问于2010-05-25得票数 3

回答已采纳

2回答

如何抓取一个网站只给定域网址与scrapy

python、web-crawler、scrapy、scrape

我正在尝试使用scrapy抓取一个网站，但网站没有网站地图或页面索引。如何使用scrapy抓取网站的所有页面？我只需要下载网站的所有页面，而不提取任何项目。我只需要在蜘蛛规则中设置关注所有链接吗？

浏览 0提问于2013-01-06得票数 5

回答已采纳

1回答

在for循环中连接数据帧

python、pandas

我写了一个类来收集公共假日数据，但我想用很多年来迭代我的类，如下所示：recent_years_read_html_()构建了一个干净的数据帧，我想附加每个数据帧。

浏览 2提问于2018-09-18得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云