python中的scrapy Crawler无法跟踪链接？ - 腾讯云开发者社区

文章/答案/技术大牛

发布

1回答

Scrapy & Splash没有从javascript页面返回任何内容

、、

我目前正在跟踪官方文档和Youtube视频，用Scrapy和它们的splash呈现服务来抓取javascript页面。爬行jsdemo‘一起运行的(我已经在本地虚拟环境中安装了scrapy (python 3.6.4)和所有正确的模块，包括scrapy-scrapy模块)。] INFO: Spider closed (finished) 上面的内容被截断，这是一个指向完整输出的链接

浏览 0提问于2018-05-11得票数 0

回答已采纳

1回答

无法在Scrapy Cloud上加载代理列表

、

模块im使用指定的"“设置，如果链接到pc上现有的txt磁贴，则在PC上可以正常工作。如果我在我的PC上像PROXY_LIST = 'proxylist.txt‘这样做，它就像一个护身符一样工作，但不是一旦我把它加

浏览 2提问于2017-05-29得票数 0

3回答

对从Python脚本中运行Scrapy感到困惑

、、

遵循，我可以从Python脚本运行scrapy，但我无法获得scrapy结果。这是我的蜘蛛：from scrapy.selector import HtmlXPathSelector scrapy crawl douban但是我无法从Python脚本中获得返回结果

浏览 1提问于2013-07-10得票数 6

回答已采纳

1回答

Python & Scrapy: Scrapy版本的问题

、、

我使用Ubuntu14.04 x64，我遵循Scrapy文档使用pip安装软件包然后，我跟踪示例项目的初始化，并尝试执行示例爬行器。/python2.7/dist-packages/scrapy/commands/crawl.py", line 43, in run spider = self.crawler.spiders.create(spname, **opts.spargs

浏览 1提问于2015-02-23得票数 5

回答已采纳

2回答

从python脚本运行scrapy

、、、

我一直在尝试从python脚本文件运行scrapy，因为我需要获取数据并将其保存到我的数据库中。但是当我用scrapy命令运行它时该脚本运行良好，但当我尝试使用脚本运行它时，请使用以下链接 http://doc.scrapy.org/en/latest/topics/practices.html#run-scrapy-from-a-sc

浏览 1提问于2014-05-10得票数 1

3回答

AttributeError：“”module“”对象没有属性“”Spider“”

、、

我刚开始学习scrapy。所以我跟踪了。我刚刚写了那个网站上提到的第一个爬虫。File "/usr/lib/python2.7/dist-packages/scrapy/command.py", line 34, in crawler File "/usr/lib/python</

浏览 0提问于2015-06-08得票数 4

回答已采纳

1回答

运行scrapy教程示例时导入错误(scrapy爬行dmoz / scrapy.core.downloader.handlers.s3.S3DownloadHandler) )

、、

我正在运行本教程中的示例。我正在运行Python2.7.8。我用pip下载Scrapy和其他必需的软件包。我相信我正确地遵循了这个教程，但我不能运行蜘蛛。我以前读过关于同一个问题的文章，但其他人仍然无法解决这个问题。 self.crawler_process.start() File &qu

浏览 2提问于2014-10-22得票数 0

回答已采纳

1回答

在运行时环境(如cgi、wsgi )中调用scrapy

我想模拟是否有给我提供HtmlXPathSelector (hxs)对象的url的刮伤实用程序？

浏览 5提问于2013-06-24得票数 1

2回答

Scrapy django模型导入错误

、、、、

当我尝试运行爬行器时，item.py总是无法导入django应用程序的模型。 File "/usr/lib/pymodules/<

浏览 0提问于2014-08-29得票数 2

2回答

如何将“`scrapy`”项目作为常规的“`python`”应用程序运行，以便从lambda运行？

、

我正在创建一个scrapy项目，其结构如下：我可以通过scrapy命令行scrapy crawl SPIDER_NAME运行这个应用程序，但是如何将这个应用程序打包成一个常规的python程序，可以在AWS lambda中运行？在命令行scrapy crawl SPIDER_NAME中，我不知道程序的入口点。handler方法作为它的入口点，那么如何以编程方式触发刮刮任务呢？

浏览 2提问于2019-07-22得票数 0

回答已采纳

2回答

Python Scrapy只爬行start_urls，然后停止。如何走得更深？

、、、

为什么Scrapy只爬行start_urls，然后停止？有没有办法让Scrapy抓取网站目录树中的所有页面，比如？或者，有没有办法让Scrapy更深入地抓取start_urls页面上的所有链接？] "http://www.dmoz.org/Computers/Programming/Languages/P

浏览 1提问于2014-11-25得票数 0

2回答

如何导入设置以覆盖它

、、

这是我的代码 self.settings.overrides['JOBDIR']= "seen" File "C:\Python27\lib\site-packages\scrapy\spider.py", line 46, in settings File "C:\Python27\lib\site-p

浏览 5提问于2014-08-18得票数 3

1回答

如何使用pip在Scrapinghub上安装中间件

、、、

我使用链接的github项目在scrapinghub上部署。 File "/usr/local/lib/python2.7/site-packages/scrapy/crawler.py", line 168,_crawl(crawler, *args, **kwargs) File "&#

浏览 4提问于2017-09-02得票数 0

1回答

python中的Scrapy Crawler不能跟踪链接吗？

、

我使用python的scrapy工具用python编写了一个爬虫。以下是python代码：from scrapy.contrib.linkextractors.sgml/@rec").extract()但是，抛出的错误不是遵循链接，而是： Traceb

浏览 2提问于2011-03-08得票数 7

1回答

安装了刮水器，但不能运行工作台或外壳。

、

我终于安装了刮擦，但无法让它运行长凳或外壳。以下是控制台中返回的内容：2018-02-19 14:46:26 [scrapy.utils.log"/Users/iSagui/Virtualenvs/scrapy_env/lib/python3.7/site-packages&

浏览 0提问于2018-02-19得票数 0

回答已采纳

1回答

错误2002 (HY000)：无法通过Lubuntu20.04LTS上的socket '/var/run/mysqld/mysqld.sock‘(2)连接到本地MySQL服务器

、、

(scrapy_course) andylu@andylu-Lubuntu-PC:~/Desktop/Misc_python_scripts/Scrapy_Webscraping_Course/books_crawler下一首,我尝试连接到mysql：( andylu@andylu-Lubuntu-PC:~/Desktop/Misc_python_scripts/Scrapy_Webscraping_Course&#x

浏览 0提问于2020-12-06得票数 0

1回答

Python Scrapy一直返回“无效语法”

、

我对scrapy非常陌生，今天是我第一次使用它。我在最基本的代码中遇到了一个问题。我一直收到一个错误，说是invalid syntax。这是我的代码，下面是我得到的错误。我是在终端中运行这个，而不是python本身。"/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/s

浏览 0提问于2018-09-12得票数 2

1回答

ImportError:没有名为“蜘蛛”的模块

、

(execute()) File "/Users/nathanielford/virtualenvironments/crawler/lib/python3.5/site-packages/scrapynathanielford/virtualenvironments/crawler/lib/python3.5/site-packages/scr

浏览 0提问于2016-12-07得票数 5

回答已采纳

1回答

尝试记录抓取时没有名为recording的模块

、、、、

当我尝试使用Frontera和scrapy记录抓取时，它会给出一个错误，说没有名为record的模块，但是，我无法理解为什么会出现这个错误，因为我已经遵循了从进行记录的步骤。请帮助并感谢您的帮助。result = g.send(result) File "/root/scrapy/scrapy/local/lib/python2.7/site-packages/

浏览 15提问于2017-07-04得票数 1

1回答

Scrapyd-Deploy:未找到SPIDER_MODULES

、、

\"/usr/local/lib/python3.8/dist-packages/scrapy/crawler.py\", line 280, in __init__\n super(CrawlerProcess__init__(settings)\n File \"/usr/local/lib/python3.8/dist-packages/scr

浏览 10提问于2020-05-07得票数 1

点击加载更多

Scrapy & Splash没有从javascript页面返回任何内容

无法在Scrapy Cloud上加载代理列表

对从Python脚本中运行Scrapy感到困惑

Python & Scrapy: Scrapy版本的问题

从python脚本运行scrapy

AttributeError：“”module“”对象没有属性“”Spider“”

运行scrapy教程示例时导入错误(scrapy爬行dmoz / scrapy.core.downloader.handlers.s3.S3DownloadHandler) )

在运行时环境(如cgi、wsgi )中调用scrapy

Scrapy django模型导入错误

如何将“`scrapy`”项目作为常规的“`python`”应用程序运行，以便从lambda运行？

Python Scrapy只爬行start_urls，然后停止。如何走得更深？

如何导入设置以覆盖它

如何使用pip在Scrapinghub上安装中间件

python中的Scrapy Crawler不能跟踪链接吗？

安装了刮水器，但不能运行工作台或外壳。

错误2002 (HY000)：无法通过Lubuntu20.04LTS上的socket '/var/run/mysqld/mysqld.sock‘(2)连接到本地MySQL服务器

Python Scrapy一直返回“无效语法”

ImportError:没有名为“蜘蛛”的模块

尝试记录抓取时没有名为recording的模块

Scrapyd-Deploy:未找到SPIDER_MODULES

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐