前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >爬虫系列(18)Python-Spider。

爬虫系列(18)Python-Spider。

作者头像
野原测试开发
发布2019-07-10 18:10:42
7780
发布2019-07-10 18:10:42
举报
文章被收录于专栏:技术探究技术探究

Python-Spider作业

day01
  • 了解爬虫的主要用途
  • 了解反爬虫的基本手段
  • 理解爬虫的开发思路
  • 熟悉使用Chrome的开发者工具
  • 使用urllib库获取《糗事百科》前3页数据
  • 使用urllib库登录《速学堂》官网
  • 爬取
    • https://knewone.com/
    • 58同城二手信息
day02
  • 获取豆瓣电影分类排行榜 -前100条数据
  • 数据opener的用法
    • opener的构建
    • 代理的使
    • cookie的使用
  • 了解cookie的作用
  • 使用cookie登录虾米音乐
  • 使用requests 库获取数据《纵横网小说排行》前3页数据
  • 使用requests 登录速学堂
day03
  • 熟练使用re,了解基本语法的使用
  • 熟练使用xpath,了解基本语法的使用
  • 掌握BeautifulSoup,掌握css的用法
  • 爬一部小说 盗墓笔记,要求保存成文件
  • 爬取小猪短租信息
day04
  • 熟练使用selenium爬取方式
  • 爬取拉钩职位
  • 80s网站的抓取
day05
  • 熟悉scrapy的基本使用(创建与运行,目录结构)
  • 爬取当当网python图书信息
  • 爬取17173游戏排行信息
day06
  • 掌握3种调试方式
    • debug
    • scrapy shell
    • test Restful 插件
  • 掌握crawlspider的使用
  • 掌握动态UA与PROXY的使用
dya07
  • 掌握3种登录的思路
  • 掌握MOngo的基本使用
  • 完成练习题 创建年级,并随机添加 10 名学生; for (var i = 1; i <= 10; i++) { db.grade.insert({ "name": "zhangsan" + i, "sex": Math.round(Math.random() * 10) % 2, "age": Math.round(Math.random() * 6) + 3, "hobby": [] }); }
    • 查看grade班级中的所有学生
    • 查看grade班级中所有年龄是 4 岁的学生
    • 查看grade班级中所有年龄大于 4 岁的学生
    • 查看grade班级中所有年龄大于 4 岁并且小于 7 岁的学生
    • 查看grade班级中所有年龄大于 4 岁并且性别值为0的学生
    • 查看grade班级中所有年龄小于 4 或者大于 7 岁的学生
    • 查看grade班级中所有年龄是 4 岁或 6 岁的学生
    • 查看grade班级中所有姓名带zhangsan1的学生
    • 查看grade班级中所有姓名带zhangsan1和zhangsan2的学生
    • 查看grade班级中所有兴趣爱好有三项的学生
    • 查看grade班级中所有兴趣爱好包括画画的学生
    • 查看grade班级中所有兴趣爱好既包括画画又包括跳舞的学生
    • 查看grade班级中所有兴趣爱好有三项的学生的学生数目
    • 查看grade班级的第二位学生
    • 查看grade班级的学生,按年纪升序
    • 查看grade班级的学生,按年纪降序
day08
  • 熟悉搭建splash的环境
  • 使用requests库结合splash爬虫当当网
  • 使用scrapy结合splash爬取瓜子二手车信息
day09
  • 熟练使用scrapy-redis插件
  • 使用scrapy-redis爬取51job求职信息
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-06-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 离不开的网 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Python-Spider作业
    • day01
      • day02
        • day03
          • day04
            • day05
              • day06
                • dya07
                  • day08
                    • day09
                    相关产品与服务
                    云数据库 Redis
                    腾讯云数据库 Redis(TencentDB for Redis)是腾讯云打造的兼容 Redis 协议的缓存和存储服务。丰富的数据结构能帮助您完成不同类型的业务场景开发。支持主从热备,提供自动容灾切换、数据备份、故障迁移、实例监控、在线扩容、数据回档等全套的数据库服务。
                    领券
                    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档