在知乎上学 Python - 爬虫篇

知乎是个好地方。虽然近年来,为了吸引更多的用户,知乎的定位与早期略有点偏离。但从内容质量和专业性来说,知乎仍然是国内数一数二的知识型社区。不少同学都是通过知乎发现了我们编程教室,我自己也经常会通过知乎去寻求一些专业知识的解答和参考。

之前,为了让大家能更好地挖掘知乎上有价值的信息,我们做了一个索引,把编程入门相关的一些问答和文章做了整理:

在知乎上学 Python - 入门篇

文中曾立下FLAG说之后会整理爬虫、数据分析、机器学习等方面的索引,然而却一拖再拖。好在现在,有同学帮我们做了后续整理,今天就把“爬虫篇”分享给大家。


注意:由于微信文中不能直接跳转外部链接,因此建议点击文末的“阅读原文”,收藏知乎原文。


有很多人正在入门Python爬虫,学习Python爬虫。在这个过程中,会遇到很多难题,许多小伙伴都会去寻找答案,但是因为答案的纷繁复杂和种类多样,往往要花上好些时间。

所以我通过整理知乎上关于Python爬虫的精彩回答文章和教程,制作一篇关于Python爬虫的索引,包括:

入门指南-教程资源-框架工具-爬虫实例-专栏索引

大家有什么好的建议和资源也可以留言提出。


入门指南: 1.如何入门Python爬虫?—谢科的回答 https://www.zhihu.com/question/20899988/answer/24923424

(简介:爬虫怎么工作以及怎么在python实现。)

2.爬虫基本原理

https://zhuanlan.zhihu.com/p/35324806

(简介:给有一些有python基础,但是对爬虫一无所知的人)

3.Python爬虫入门

第一讲:Python爬虫|Python爬虫入门(一):基本

https://zhuanlan.zhihu.com/p/21377121?refer=xmucpp

第二讲:Python爬虫|Python爬虫入门(二):请求

https://zhuanlan.zhihu.com/p/21394571

第三讲:Python爬虫|Python爬虫入门(三):解析

https://zhuanlan.zhihu.com/p/21442500

第四讲:Python爬虫|Python爬虫入门(四):储存

https://zhuanlan.zhihu.com/p/21452812

(简介:本爬虫系列入门教程假设读者仅有一点点Python基础或者近乎为零的基础。如果是有Python基础的可以跳过一些对于Python基本知识的补充。)


教程资源:

书籍:

1.一份Python爬虫电子书 (路人甲)

https://zhuanlan.zhihu.com/p/28865834

(简介:这本书主要内容是Python入门,以及Python爬虫入门和Python爬虫进阶)

2.问题:求大神们推荐Python入门书籍

https://www.zhihu.com/question/38801925/answer/184406876

(简介:Python爬虫方面入门书籍推荐)

教程:

系列教程:

1.Python爬虫学习系列教程

https://zhuanlan.zhihu.com/p/25949099

(简介:学习过程中我把一些学习的笔记总结下来,还记录了一些自己实际写的一些小爬虫)

2.Python爬虫教程(一)使用request+Beautifi

https://zhuanlan.zhihu.com/p/35493091

Python爬虫教程(二)使用request+正则re批量下载好听轻音乐网歌曲https://zhuanlan.zhihu.com/p/35528714

3.python爬虫初探(一):爬虫的基本结构

https://zhuanlan.zhihu.com/p/32652572

python爬虫初探(二):URL管理器和下载器

https://zhuanlan.zhihu.com/p/32673371

python爬虫初探(三):HTML解析器

https://zhuanlan.zhihu.com/p/32675668

python爬虫初探(四):数据存储器

https://zhuanlan.zhihu.com/p/32697330

拓展教程:

1.爬虫万金油,一鹅在手,抓遍全球:goose 简介https://zhuanlan.zhihu.com/p/46595420

2.这个男人让你的爬虫开发效率提升8倍

https://zhuanlan.zhihu.com/p/38466193

3.Python 抓取网页乱码原因分析

https://zhuanlan.zhihu.com/p/21057822

4.干了这碗“美丽汤”,网页解析倍儿爽

https://zhuanlan.zhihu.com/p/58445021

进阶拓展:

进阶:

1.Python爬虫进阶

https://www.zhihu.com/question/35461941/answer/192693594

https://www.zhihu.com/question/35461941/answer/72909421

(简介:爬虫无非分为这几块:分析目标、下载页面、解析页面、存储内容)

2.“百行代码”实现简单的Python分布式爬虫

https://zhuanlan.zhihu.com/p/26045460

(简介:进阶知识)

拓展:

1.利用爬虫技术能做到哪些很酷很有用的事情?

https://www.zhihu.com/question/27621722

2.Python爬虫学到什么样就可以找工作了https://www.zhihu.com/question/61103114/answer/183926752

3.从python爬虫,到更爱这个世界

https://zhuanlan.zhihu.com/p/32711505

4.Python爬虫和情感分析简介

https://zhuanlan.zhihu.com/p/20359324

5.你是如何开始能写Python爬虫?

https://www.zhihu.com/question/21358581/answer/274132025

爬虫资源:

1.一个很“水”的Python爬虫入门代码文件

https://zhuanlan.zhihu.com/p/22982208

2.156个Python网络爬虫资源!

https://zhuanlan.zhihu.com/p/28407245

3.可能是最全面的75个Python爬虫资源

https://zhuanlan.zhihu.com/p/27985429

学习经验: 1.用Python写爬虫时应该注意的坑?

https://www.zhihu.com/question/49296232/answer/368313956

2.Python3网络爬虫学习建议?

https://www.zhihu.com/question/41277528/answer/95885043

3.Python爬虫知识点梳理

https://zhuanlan.zhihu.com/p/29523349

4.常用的 Python 爬虫技巧

https://zhuanlan.zhihu.com/p/23088379

5.如何优化Python爬虫的速度?

https://www.zhihu.com/question/20145091/answer/618321662

6.Python爬虫—破解JS加密的Cookie

https://zhuanlan.zhihu.com/p/25957793

7.主流网站 Python 爬虫模拟登陆方法汇总

https://zhuanlan.zhihu.com/p/59733826

8.三步走,教你定制自己的个性Python爬虫

https://zhuanlan.zhihu.com/p/23178014

9.Python爬虫传送post请求要携带哪些参数?https://www.zhihu.com/question/60256922/answer/174211193


框架工具:

框架: 1.Python有哪些常见的、好用的爬虫框架?

https://www.zhihu.com/question/60280580/answer/617068010

2.一个极为简洁的Python爬虫框架

https://zhuanlan.zhihu.com/p/23017812

3.拥有属于自己的Python爬虫框架--练习编写多线程、协程爬虫框架https://zhuanlan.zhihu.com/p/24469566

工具:

1.10个爬虫工程师必备的工具了解一哈

https://zhuanlan.zhihu.com/p/54855072

(简介:工欲善其事必先利其器的道理相信大家都懂。)

2.推荐4个爬虫抓包神器

https://zhuanlan.zhihu.com/p/61980749

(简介:今天推荐4个HTTP代理工具通过抓包分析,帮助你还原APP背后的每个请求。)

3.爬虫必备工具,掌握它就解决了一半的问题

https://zhuanlan.zhihu.com/p/39340856

(简介:今天这篇文章不谈任何具体网站的抓取,只来说一个共性的东西:如何通过 Chrome 开发者工具寻找一个网站上特定数据的抓取方式。)

4.听说你好不容易写了个爬虫,结果没抓几个就被封了?

https://zhuanlan.zhihu.com/p/28726244

(简介:实现一个自动获取可用代理 IP 的接口。)


爬虫实例:

1.利用python爬取网易云音乐,并把数据存入mysqlhttps://zhuanlan.zhihu.com/p/34354440

2.python爬取20w表情包之后,从此你就成为了微信斗图届的高手https://zhuanlan.zhihu.com/p/66243518

3.如何让Python爬虫一天抓取100万张网页

https://zhuanlan.zhihu.com/p/65508954

4.Python爬虫告诉你上海房价有多高

https://zhuanlan.zhihu.com/p/40293278

5.Python爬虫入门 | 2 爬取豆瓣电影信息

https://zhuanlan.zhihu.com/p/32037625

6.Python爬虫一步步抓取房产信息

https://zhuanlan.zhihu.com/p/25713752

7.我用Python又爬虫了拉钩招聘,给你们看看2019市场行情https://zhuanlan.zhihu.com/p/65081383

8.爬虫爬了下知乎上的神回复,已笑趴~

https://zhuanlan.zhihu.com/p/46132179

9.一键下载:将知乎专栏导出成电子书

https://zhuanlan.zhihu.com/p/44918640

10.如何用Python抓抖音上的小姐姐

https://zhuanlan.zhihu.com/p/46396868

11.【招聘数据分析】Python就业前景如何

https://zhuanlan.zhihu.com/p/35027220


专栏索引:

Python爬虫索引:

1.如何入门爬虫(路人甲)

https://zhuanlan.zhihu.com/p/21479334

(简介:一个知乎大神整理的关于Python爬虫的索引,内容详细全面,结构完整。对于新手和正在学习的小伙伴是非常有帮助的。)

2.从零开始写Python爬虫(Ehco)

https://zhuanlan.zhihu.com/p/26673214

(简介:提供了实用的方法和建议)

3.自学入门 Python 优质中文资源索引

https://zhuanlan.zhihu.com/p/49798116

(简介:自学入门Python的整理,有关于Python爬虫的索引)

Python爬虫号推荐:

1.蚍蜉撼大树

https://www.zhihu.com/people/handashu/posts/posts_by_votes

(简介:Python爬虫之旅系列)

2.州的先生

https://www.zhihu.com/people/zmister/posts/posts_by_votes?page=2

(简介:python爬虫实战入门系列)

3.学习python的正确姿势

https://www.zhihu.com/people/xue-xi-pythonde-zheng-que-zi-shi-92/posts/posts_by_votes

(简介:Python爬虫实战系列)

4.不吃夹生饭

https://www.zhihu.com/people/bu-chi-jia-sheng-fan/posts

(简介:反反爬虫系列)

爬虫项目索引: 1.资源整理|32个Python爬虫项目让你一次吃到撑

https://zhuanlan.zhihu.com/p/27938007

(简介:32个爬虫项目)

2.GitHub上有哪些优秀的Python爬虫项目?

https://www.zhihu.com/question/58151047/answer/640461600

(简介:GitHub上优秀的Python爬虫项目)

3.23个Python爬虫开源项目代码,包含微信淘宝,豆瓣知乎,微博等

https://zhuanlan.zhihu.com/p/58851666

本文分享自微信公众号 - Crossin的编程教室(crossincode)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-09-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

扫码关注云+社区

领取腾讯云代金券