前言
快到寒假了,我打算更新一个系列。《从零开始学Python网络爬虫》就是这个寒假要更新的内容,希望大家能喜欢。因为是寒假,有很多不确定因素,将进入不定期更新,原因大家都懂的。但我会尽量多更新!!!
HTML+CSS+Javascript我也会不定期更新
本系列主要讲解学习本书内容,所收获的知识和总结;个人看法及补充。(如果不能展现作者精髓也请见谅!)本书使用的是Python3.5.3
本书内容
第一章 Python零基础语法入门
第二章 爬虫原理和网页构造
第三章 我的第一个爬虫程序
第四章 正则表达式
第五章 Lxml库与Xpath语法
第六章 使用API
第七章 数据库存储
第八章 多进程爬虫
第九章 异步加载
第十章 表单交互与模拟登录
第十一章 Selenium模拟浏览器
第十二章 Scrapy爬虫框架
计划
第一章内容因为过于简单,讲起来也没意思,所以不打算讲。第一章我将会聊一些“网络数据采集的法律与道德约束”,如果你想要学习网络爬虫,这方面的知识是必不可少的,虽然现阶段国内好像没有相关法律约束,但各个网站都有自己的Robots.txt协议,来限制网络爬虫
其他章节内容,计划一个星期更新一章
结束语
本书主要以项目为驱动,理论层面东西较少,适合初学者。
领取专属 10元无门槛券
私享最新 技术干货