前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >经验分享:0基础如何学Python、爬虫

经验分享:0基础如何学Python、爬虫

作者头像
py3study
发布2020-01-15 01:07:02
5230
发布2020-01-15 01:07:02
举报
文章被收录于专栏:python3python3

主要讲述转型的三个方面:web开发,爬虫,数据分析与人工智能

Python的发展主要有几个方向:

网络,爬虫,数据分析,测试,运维,人工智能等,要属当下最火的还是人工智能,好多人冲着人工智能的方向学python,其实人工智能听起来确实很高大上,都想往这方面涌入,但是作为过来人,如果单纯从编程0基础想转行人工智能还是难度相当大的(大神除外),因为好多搞人工智能的公司会相对比较大,现在企业又不愿意去培养人,所以招聘时候学历,专业,项目经验,工作年限都相对还是比较硬性的。

虽然门槛比较高,但是想转行python进而转型数据分析和人工智能也是有很大机会的,毕竟python在国内火起来也没多长时间,只要按照科学有效的方法学习提升,也是可以很快转型的,由于对运维和测试不是特别了解,这里不在说这方面的转型路线,先讲web后端开发、爬虫开发、数据分析与人工智能路线。

学习python过程中有不懂的可以加入我的python零基础系统学习交流秋秋qun:前面是934,中间109,后面是170,与你分享Python企业当下人才需求及怎么从零基础学习Python,和学习什么内容。相关学习视频资料、开发工具都有分享

1,首先是转行python学习路线:

通用必备基础知识 :(这些知识不管是做python哪方面,都是基础知识,必须会)

第一阶段:Python入门(框架再怎么变,基本语法不会变,基础中的基础)

数据类型

循环判断

常用模块

函数,迭代器,装饰器

递归,迭代,反射

面向对象编程

第二阶段:网络编程(最好能完全搞透彻)

Socket c / s编程,Twisted异步网络框架

多线程,多进程,携程gevent,选择\ poll \ epoll

FTP服务器开发

批量命令,文件分布工具

RabbitMQ消息队列,SqlAlchemy ORM

Reids \ MemCache \ MongoDB缓存数据库

第三阶段:正则表达式和数据库

学习字符串匹配的正则表达式重模块

学习的MySQL的数据库(80%以上的公司都在用)

学习的Redis的数据库(做网站和爬虫都很重要)

学习的MongoDB的数据库

第四阶段:WEB前端基础(坑比较多,多敲)

做WEB当然要懂点基本的前端知识。

html / css基础

 原生JS 

JQuery的的(JS库)

Ajax的异步加载

 绘图库

引导(了解,最好能掌握一种布局框架)

好了,以上就是不管你后面发展那些方面,这些都是基础中的基础,必须要学

2,转型python的网站后端开发学习的知识:

Django的(应用广泛的后端框架)

tornado

flask(后起之秀的框架)

session/中间件/ ORM / CSRF / FORM(一些网络基本的技术知识)

Django,flask,tornado,三个框架各有优劣,网页框架我用的Django和flask居多,Django的会觉得很多东西都已经封装好了,可以直接用,不用自己手动构造,比如Django的的管理的后台和xadmin后台,flask就相对灵活多变,至少掌握两个框架,多多益善(我在培训班1个半月,学的django和flask2个框架)

3,转型爬虫学习的知识:

requests:发送网页请求,返回数据

xpath:用于网页元素的提取(当然还有BS4,pyquery等,选择顺手的)

selenium:用于真实浏览器访问网页,根据具体情况使用

scrapy:用于大规模快速网页数据爬取

验证码破解:验证码破解建议大家可以多搞点难破解的,比如滑块验证码,淘宝验证码,12306验证码等等,面试经常问到哦

4,转行数据分析(机器学习,人工智能)学习路线:

(以下几个模块是数据分析最常用的库,一定要学好)

1,学习科学计算和分析包,numpy的和pandas

2,学习可视化,分析结果可视化的包matplotlib,实现数据绘图展示

3,学习数据挖掘模型,这个包主要是sklearn,里面的算法基本都有对应的包,但希望大家能对高等数学,概率论,线性代数,信息论的基础理论进行学习,这些算法都是基于数学基础,如果数学理解不透,也只能当一个调包侠

4,神经网络的框架,推荐学习TensorFlow或者keras,Karas的是把TensorFlow封装起来的高级包,学习难度比较低。还有一个更加高级的框架CAFFE,据说很厉害。

5,常见神经网络:回归网络,分类网络,卷积神经网络(CNN)在图像语言等领域处理方面优秀,循环神经网络(RNN)利用时间序列分析(RNN LSTM),避免过度拟合。自编码网络,这个我不了解,也不感兴趣。神经网络还很多,技术前沿的东西还不知道。

好了,说到这里,基本学习路线就讲完了,下面就是最基本的学习路线总结

转型web:通用必备知识+2个网页框架

转型爬虫:通用必备知识+爬虫框架

转型数据分析:通用必备知识+数据分析库(pandas,numpy的的,matplotlib,sklearn),甚至这些还远远不够用

转型人工智能:通用必备知识+数据分析库+高等数学+线性代数+概率论+ tensorflow框架

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2019-06-10 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
验证码
腾讯云新一代行为验证码(Captcha),基于十道安全栅栏, 为网页、App、小程序开发者打造立体、全面的人机验证。最大程度保护注册登录、活动秒杀、点赞发帖、数据保护等各大场景下业务安全的同时,提供更精细化的用户体验。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档