前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Scrapy ---- 使用步骤

Scrapy ---- 使用步骤

作者头像
SuperHeroes
发布2018-05-30 16:59:05
7350
发布2018-05-30 16:59:05
举报
文章被收录于专栏:云霄雨霁云霄雨霁

python、scrapy和pycharm已经安装好,并且python和scrapy环境已经配置好。scrapy安装比较简单的方法是通过pycharm IDE进行安装。

一、创建工程

命令行输入:scrapy startproject object_name

object_name是目标项目的名称。

此命令生成的目录结构如下:

接下来,在spiders文件夹下面创建.py文件,我们的爬虫代码就写在这个文件里面。可以直接在Pycharm里面创建,也可以通过命令行创建。

genspider命令:scrapy genspider spider_name url

spider_name 是spider的名字,url是要爬取的网站。

通过命令行创建后,文件中会自动生成相关代码:

运行spider: 命令行>>scrapy crawl spider_name

二、使用item

工程创建好后会自动生成一个items.py文件,我们只需要在这个文件中定义自己的item。

比如我需要爬取标题、链接和描述,则可以这样定义item:

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2017.10.10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、创建工程
  • 二、使用item
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档