文章详情:Python爬虫与数据挖掘
1.
这几天陆续收到很多读者、球友的留言、私信,说要怎么学Python?有没有基础的,偏小白的学习方法?我的回答是:等我统一答复。
小胖从不食言,今天就来说说我觉得一个零基础、想转行、一直不得法的人应该如何入门。
2.
对于Python来说,一直有个误区,那就是「Python很简单」。
不知道你有没有、或者曾经有过这样的想法。我也能理解,毕竟一句话就能打印hello world,3行代码就能人脸识别,真的太简单了。
但这真的是Python的全部吗?如果你只是满足于依靠强大的社区、优秀的第三方库来满足你对于Python的好奇,那是完全可以的。但可千万别把这当作Python的全部啊!
Python的高阶函数、装饰器,反射、元编程、各种魔术方法,Python的解释器运行机制是什么,垃圾回收原理又是什么,为什么Python多线程鸡肋?GIL无解了吗?
你看,上面这些问题,每一个我都能拉出来讲一篇,有的甚至2-3篇,这才是Python的精髓,应该学的,而且越学越有意思。
3.
那就来说说零基础要怎么入门Python,又怎么把Python学好了。
我相信关注我读者的不少人都是写过Python的,所以应该多少也买过几本Python的书吧?Python的书真的很多,特别是针对初学者的书多如牛毛,数不胜数,就连我自己都想出一本书了……那其实呢?大家都差不多吗,初学者的书一定要选好,为什么?因为这直接决定了你之后的学习曲线以及学习积极性。那我这里推荐给大家的就是「笨办法学Python」(这里没有广告,如果一定要有,@笨办法学Python作者,是不是该给我打稿费了啊,喂!)
这本书相对简单,说的东西都很浅显,建议你花几天时间集中看完,很快的,因为没啥深奥的原理,都是敲敲代码,就过去了。关键的地方来了,这也是我和其他大佬不同的地方,看到这里你就赚了。
4.
我推荐大家迅速的过书,到函数那一章就完事了,装饰器也别看了,别问我为什么,吻我就好。
因为装饰器将会成为你学习Python以来第一个难关,会打压你,在你学习不到3天的时候,真的不好。
那看到装饰器不看了,接下来干嘛呢?经典的来了,去做东西!所谓看五遍不如敲一遍就是这理。那么练什么呢?才学了这点能练什么?
放心,多得去了。你学Python应该多少会点Linux的命令吧?就算你不会,也可以搜一下吗,反正也不难
。然后精彩的来了,我们就拿 ls 这个命令来说,用Python来实现一个 ls.py 行不行?
我猜你看到这里,嘴里冒出一句「卧槽」「我次奥」,很正常,突破认知范围了是不,怎么会这么骚?我怎么就没想到?
第一个版本很简单,记住了MVP法则,MVP讲究的就是最小可行性,你现在需要做的不是几百行的完整 ls 功能,而是一个最简单的 ls 功能,什么意思?回想一下 ls 在不加入任何参数的情况下,是什么效果?没错,就把这个实现了。效果就是 python ls.py 等同于 ls 命令。
在这个MVP版本的实现过程中,你一定会遇到很多的困难,毕竟你到现在只学会了程序结构、数据结构、函数,模块调用还不会,怎么办?查啊。当你发现你不知道怎么获取当前目录下的所有文件及文件夹的时候怎么办?查啊。
5.
发现没有,再经过MVP版本后,你已经学会了os的相关函数使用了,你已经知道模块的引入语法了,这些可都是书里看到现在没有讲的哦。
接下来就进入产品的迭代周期了,这个时候你需要不断去扩展功能,ls.py的功能就是它的参数,这些参数的意义通过man函数都可以查到。相信我,每做一个参数,你都能学到很多东西,因为现在的你是一张白纸,想要上点颜色太简单了。需要提一下的是,你要每天坚持写点Python,只有每天写,你才会在不经意间成为那个让零基础的人们羡慕的对象。
2周过去了,你会发现功能迭代的80%了,在你的武器库里又多了很多的技能,argparse咯、psutil咯、sys咯等等,是不是有点自喜了?没错,要的就是这个。最后你要做的就是把代码优化一下,而不是一个冗长的1000行的文件,虽然现在还没有类的引入,也没有任何高级用法,只是把函数分门别类的整理出来。这就够了。
6.
经过这么一段时间的练习,我相信你已经和之前刚入门的你完全不一样了,接下来可以继续看书了,把面向对象、魔术方法、并发都看了。再来写一个find 命令。
相信我,2个命令写下来,你的能力已经得到了显著的提升,现在的你已经有了2个实打实的项目,比那些个个人博客项目要硬的多。
然后再去看看web前端的东西,慢慢接触点爬虫、网站开发、框架使用都是水到渠成的事了。
以上就是我个人给予大家的一些建议,称不上过来人,我只是一个走在学习路上不断踩坑试错的践行者,除了学习外,就是把学习的过程分享出来,让获悉者受益,仅此。
------------------- End -------------------
本文分享自 Python爬虫与数据挖掘 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!