首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Scrapy 框架实践爬虫-实践篇二

在之前从网页解析出了我们想要的数据详情请看Scrapy 框架实践爬虫--实践篇, 趁热打铁 , 接下来就是将数据储存在本地数据库中。1.将数据转化为对象进行储存前面提到过 , 在 Scrapy 中通过 pipeline 进行储存。当然现在还没有创建存储的类 , 所以在操作 pipeline 之前 , 先创建一个 item。

接下来就是操作 pipeline 来存储数据将数据存入本地的数据库 , 我选择的是 mysql 数据库 , 要用 python 操作 mysql 数据库 , 还需要下载 python 库 pymsql。

2.将数据存储到数据库中在将数据存储到数据库之前 , 先创建一个数据表。

接下来 , 需要一个操作数据库的类 , 之后进行数据库操作的时候 , 直接通过这个类就可以了。在这个类中 , 需要有一个 insert 方法和判断数据是否存在的方法。

接下来只需要在 pipeline 中调用数据库操作即可

对了 , 还需要在 settings 文件中指明使用的 pipelines:

大功告成~代码地址:https://github.com/zengln/DSpider

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180226G15S6Q00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券