我使用scrapy 0.16从LinkedIn中提取数据。
from scrapy.selector import HtmlXPathSelector
from scrapy.contrib.linkextractors.sgml import SgmlLinkExtractor
from scrapy.contrib.spiders import CrawlSpider, Rule
from scrapy.http import Request
from scrapy import log
from linkedin.items import LinkedinItem, PersonProfileItem
from os import path
from linkedin.parser.HtmlParser import HtmlParser
import os
import urllib
from bs4 import UnicodeDammit
from linkedin.db import MongoDBClienthttps://github.com/pondering/scrapy-linkedin
错误来了
Traceback (most recent call last):
File "C:\Users\TAWANE DUDEZ\Desktop\linkedin\linkedin\spiders\LinkedinSpider.py", line 6, in <module>
from linkedin.items import LinkedinItem, PersonProfileItem
ImportError: No module named linkedin.items找不到linkedin.items模块。
发布于 2013-03-18 17:13:23
我怀疑您试图从错误的目录运行scrapy crawl LinkedinSpider命令。请尝试导航到C:\Users\TAWANE DUDEZ\Desktop\linkedin,然后再次运行该命令。
由于crawler现在正在启动,因此在启动crawler之前,您还需要运行MongoDB实例。正在使用的github项目的自述文件显示输入mongod来启动一个实例。只是为了检查一下,你确实安装了MongoDB和pymongo,对吗?
https://stackoverflow.com/questions/15472006
复制相似问题