scrapy 爬取js网页 - 腾讯云开发者社区

文章/答案/技术大牛

发布

0回答

为什么用xpath提取数据保存到数据库会带有<span class="title">xxxx</span>这样的html标签？

、、、、

我的本意是只想爬取xxxxx，为何标签也被爬取了呢图片

浏览 115提问于2023-08-23

2回答

你好可以把您那个爬取二手房价信息的那些个源代码发我一份不？

、、

Scrapy爬取二手房信息+可视化数据分析谢谢

浏览 188提问于2021-12-30

1回答

在不使用scrapy为每个页面生成/创建请求/方法的情况下，抓取网站上的多个页面的有效方法是什么？

、、、、

举个例子，我使用Yelp。Yelp不列出电子邮件，所以如果你想获取Yelp的电子邮件，你需要抓取一个列表，然后向该列表网站发出请求，并抓取一封电子邮件。目前，我正在搜索列表网站的主页，如果电子邮件、电话号码等没有列在该页面上，那么我会加载联系人页面并在那里进行检查。我遇到的问题是，我正在寻找的信息并不总是在这些页面上。理想的做法是加载网站上包含某些关键字的所有链接，然后创建一个方法，通过所有这些页面查找电子邮件、电话号码等，并在找到时返回它们。做这件事的好方法是什么？以下是我目前如何在网站页面中爬行： Rule(LinkExtract

浏览 0提问于2015-10-07得票数 1

1回答

如何使用wget下载页面，但如果页面不存在，则忽略404错误消息？

有没有办法让wget在下载网址或爬取网页时忽略HTTP错误响应码？

浏览 5提问于2015-08-19得票数 6

回答已采纳

2回答

如何用python爬取数据并保存到excel？

利用python爬取豆瓣电影排行榜（https://movie.douban.com/chart)的数据并保存到excel中。用相同代码爬取网页豆瓣top250的数据可以爬取到excel中，但将网址及相关信息改为网页豆瓣电影排行榜中的信息时便无法爬取，也找不出问题所在。以下图片为完整代码。

浏览 480提问于2021-01-09

2回答

Scrapy没有拿起我的url

、、

我有一个破烂的代码，应该能够采取电话和地址从一个网页中的表格： name="People"2017-02-15 20:14:26 [scrapy.utils.log] INFO: Scrapy 1.3.2 started (bot', 'scrapy.exte

浏览 0提问于2017-02-16得票数 0

2回答

抓取网页信息的内部链接

、

我正在尝试爬取页面这是我的代码片段：from scrapy.contrib.spiders import CrawlSpider, Rule class IT(sc

浏览 20提问于2017-08-21得票数 1

1回答

如何使用scrapy从页面中提取所有href内容

、

我在试着爬。import scrapyfrom scrapy.spiders import CrawlSpider, Rulefrom lxml import html name = 'linkd

浏览 3提问于2016-10-07得票数 2

回答已采纳

1回答

如何获得详细信息页，并遵循与Scrapy的链接？

、、、、

我想爬一个成人故事网站。我有很多网站要爬。例如，我想抓取2个网站，如下所示：from scrapy.selector import HtmlXPathSelectorfrom scrapy.http import HtmlResponse name = "cerita" all

浏览 0提问于2018-07-12得票数 1

1回答

使用scrapy递归地爬行站点

、、

我需要爬行的网页网址如下所示：2我需要爬的下一页是：4这是我迄今为止根据Scrapy教程编写的代码：from scrapy.contrib.linkextractors.sgml import SgmlLinkExtractor from scrapy.selector

浏览 4提问于2014-02-04得票数 2

回答已采纳

2回答

请问一下页面上的图片，怎样获取它的URL呢？

、

浏览 399提问于2020-10-26

0回答

scrapy怎么实现自定爬取深度？

、

我想实现对一个网址的图片进行下载，然后对该网址里面所有a标签里面的链接的图片进行下载，以此类推，这是我写的代码，求教大佬怎么做到在spider里用循环实现自定义深度啊import scrapyfrom ..items import ImgspiderItem url = input("请输入要爬</em

浏览 322提问于2020-04-13

1回答

Scrapy和XPath从亚马逊提取评论

、、

我对python和scrapy比较陌生，对于我正在尝试解决的问题，我需要一些帮助。我正在尝试爬取亚马逊，并提取用户的评论，为特定的产品使用scrapy和XPath。

浏览 1提问于2012-04-16得票数 1

回答已采纳

1回答

Scrapy :拒绝子域不能工作，为什么？

、

我在学刮痕，试着爬www.google.com/.*。我编写了下面的蜘蛛程序，但它仍然访问像support.google.com这样的子域。我遗漏了什么？import scrapyfrom scrapy.linkextractors import LinkExtractorprint('Processing {}'.format(response.url)) 注意:调试输出太多了，所以我在setting

浏览 0提问于2018-06-11得票数 1

回答已采纳

2回答

关闭浏览器或单击中止时，脚本不会停止

、、

我写了一个网络爬虫，它在do while循环中调用网页，循环时间为3秒总共有7000个网站...我解析数据并将其保存在我的数据库中。

浏览 0提问于2010-01-22得票数 0

0回答

新浪微博搜索是否禁用了huginn，有什么解决办法吗？

比如，用huginn爬网这个链接： https://s.weibo.com/weibo?换了其他地方的机器，电脑和ip不同，huginn照样无法正常爬取。而在同一台机器上用下载工具甚至简单的脚本下载这个链接的网页内容，却可以实现，不知道是什么情况。

浏览 169提问于2021-09-28

1回答

抓取输入来自文本框的网页。

、、

我想爬这个网站：但我的问题是：当我输入收据号码时，网页的网址在提交后不会更改。appReceiptNum" class="form-control textbox initial-focus" maxlength="13" type="text

浏览 2提问于2015-08-20得票数 0

回答已采纳

1回答

刮刮上的空列表响应提取

、、

我是新来的刮痕，我必须爬一个网页进行测试。所以我在终端上使用下面的代码，但是它返回一个空列表，我不明白为什么。当我用正确的选择器在另一个网站上使用相同的命令，比如amazon，它就能工作。非常感谢 scrapy shell "'https://www.woolworths.com.au/shop/browse/drinks/cordials-juices-iced-teas/iced-teas

浏览 2提问于2019-09-05得票数 0

回答已采纳

1回答

Scrapy访问被拒绝爬取网站的头部

、、、

我想抓取一个网站，但我得到了下一个错误： '<head>\n<title>Access Denied</title>\n</head>' 我只是在控制台中尝试： scrapy shell https:

浏览 27提问于2020-07-14得票数 1

回答已采纳

1回答

如何使用Scrapy在页面中爬行？

、、

我使用Python和Scrapy来回答这个问题。links = getlinks(A) B = getpage(link) image = getimage(C) 然而，当我试图在Scrapy中解析多个页面时，我遇到了一个问题。(注意:我

浏览 1提问于2013-06-10得票数 5

回答已采纳

点击加载更多

为什么用xpath提取数据保存到数据库会带有<span class="title">xxxx</span>这样的html标签？

你好可以把您那个爬取二手房价信息的那些个源代码发我一份不？

在不使用scrapy为每个页面生成/创建请求/方法的情况下，抓取网站上的多个页面的有效方法是什么？

如何使用wget下载页面，但如果页面不存在，则忽略404错误消息？

如何用python爬取数据并保存到excel？

Scrapy没有拿起我的url

抓取网页信息的内部链接

如何使用scrapy从页面中提取所有href内容

如何获得详细信息页，并遵循与Scrapy的链接？

使用scrapy递归地爬行站点

请问一下页面上的图片，怎样获取它的URL呢？

scrapy怎么实现自定爬取深度？

Scrapy和XPath从亚马逊提取评论

Scrapy :拒绝子域不能工作，为什么？

关闭浏览器或单击中止时，脚本不会停止

新浪微博搜索是否禁用了huginn，有什么解决办法吗？

抓取输入来自文本框的网页。

刮刮上的空列表响应提取

Scrapy访问被拒绝爬取网站的头部

如何使用Scrapy在页面中爬行？

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐