首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

python爬虫scrapy极致教学开始了-工具篇

由于工作忙,好久没写了,今天来介绍下scrapy爬虫框架工具,但不是全部,后续有部分模块的需要用的时候才安装

1:系统win7 64位

2:解释器:anaconda最新版,内置Python3.5(同样是Python开发者吉多维护的,但已经安装了很多的包,比原始的Python好很多)

3:pycharm,目前来说比较好的IDE了,支持自动补全,也可以用其他的代替

4:数据库 MySQL(其他的有些数据库针对性强,有些很难搞,如果有需要再学其他数据库即可,这里只介绍用户数比较多开源免费比较大众的)

5:连接数据库软件Navicat

:以下是各种基础需要的包

更新pip,(看自己是否需要)

python -m pip install --upgrade pip

在Python目录下在cmd 中Scrapy 如果无法安装,则先安装Twisted

pip install Twisted-17.9.0-cp35-cp35m-win_amd64.whl

(这里的whl需要下载文件,无法直接安装)

安装acrapy,可以直接安装,用豆瓣源加速下载

a:pip install -i https://pypi.douban.com/simple scrapy

或者 conda install Scrapy

b:pip install -i https://pypi.douban.com/simple pypiwin32

(后续会用到)

c:pip install -i https://pypi.douban.com/simple mysqlclient

(连接数据库MySQL)

解决opentype出现的问题

pip install -i https://pypi.douban.com/simple pyOpenSSL cryptography

pip install -i https://pypi.douban.com/simple -I -U service_identity

pip install service_identity-17.0.0-py2.py3-none-any.whl (需要下载文件安装)

pip install -i https://pypi.douban.com/simple --upgrade google-auth-oauthlib

验证码安装模块(pytesseract pillow俩者选一)

pip install -i https://pypi.douban.com/simple pytesseract

pip install -i https://pypi.douban.com/simple pillow

这些是基础的模块,很多都是基本的模块,让你直接跳过各种大坑

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180315G1JN0J00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券