[学习指南]Python数据分析和数据挖掘学习路线图

Python是一种面向对象、直译式计算机程序设计语言,由Guido van Rossum于1989年底发明。由于他简单、易学、免费开源、可移植性、可扩展性等特点,Python又被称之为胶水语言。由于Python语言的简洁、易读以及可扩展性,在国外用Python做科学计算的研究机构日益增多,一些知名大学已经采用Python教授程序设计课程,并且也广泛用于商业领域。

下图为主要程序语言近年来的流行趋势,Python受欢迎程度扶摇直上,十年的时间一直是徐徐上升,最近大数据的兴起,Python作为数据挖掘编程语言备受数据科学家们的青睐。

PYPL——编程语言流行指数。

今天,PPV课Gary老师针对Python在数据分析领域的应用,从数据分析师从业者的角度为大家整理了一份Python数据分析入门学习路线图和相关课程,以供大家学习和参考。课程分为4个模块:

Python语言基础

Python数据挖掘基础

Python文本挖掘基础和实例

Python数据挖掘案例应用

此学习路线由浅入深,从基础到案例实践,手把手教你如何用Python做数据分析和数据挖掘。

python数据分析学习路线图

第一部分是Python基础部分,主要是环境的搭建,库的安装,基础语法的了解,学习时间2周

包括Python开发环境的搭建(使用Anaconda+pycharm,安装该环境包含了上课所需要的所有库,即包含numpy、pandas、scipy、matplotlib、scikit-learn等等,网上搜索Anaconda、pycharm即可获取安装。)基础语法的了解,语言的示例和规范,变量、常量、运算符、表达式相关基础知识。

第二部分是Python数据挖掘的基础,主要是python数据分析相关库的学习和应用,学习时间2周

Python数据挖掘基础主要是对数据分析相关库的使用,比如数据整理需要用到numpy和pandas库,数据描述与分析分析则主要用到pandas库,用Scipy处理非结构化数据,使用回归线性模型和回归树模型进行预测等等用python做数据分析和数据挖掘的库的应用。

第三部分是Python做文本挖掘及案例分析,主要是python爬虫的学习和应用,学习时间2周

数据分析离不开数据采集和爬取。第三部分主要是教如何利用Python进行网络爬虫,以及通过案例学习文本分类和聚类相关知识。学习时间2周

第四部分是Python数据挖掘案例,主要通过讲解案例和动手实践案例,达到知识的融会贯通的应用。学习时间2周

第四部分主要是动手、实践,将上面学习到的理论知识得以应用。第四部分案例覆盖决策树、朴素贝叶斯、最近邻、随机森林、支持向量机、神经网络等重要的数据挖掘方法。拟完成的案例包括不限于以下:使用关联规则进行购物篮分析、垃圾邮件的识别、图像识别、Iris数据挖掘的各种方法比较、电影或者图书推荐系统构建、屏蔽网页内容、街景识别和分类、手写文字的识别、最近邻回归进行预测、降维的各种方法、k-means聚类和中位数聚类等等。含经典编程写算法和scikit-learn等。

最后,除了系统的学习上述相关知识之外,最主要的还是要复习,实践,实践,实践,最后才能真正出师,成为Python数据分析和数据挖掘高手。关于本课程的系统学习,大家可以跟着Gary一起学习《Python数据挖掘实战》课程,系统的学习上述内容,到时候老师会通过直播互动的形式跟大家一起探讨学习。

相关中文资源如下: 1.python工作集成环境包 Python(x,y):下载地址:http://python-xy.github.io/downloads.html Pycharm:下载地址:http://www.jetbrains.com/pycharm/download/#section=windows 2.python数据分析相关库(Pandas/Numpy/Scipy/Matplotlib) 如果安装了上面集成工作包,则下面的包不需要重新安装了。关于包的安装方法在学习资源图书中都有介绍,通常安装库采用pip方法,也可以用pip list查询系统安装了哪些库。 3.学习资源 图书: 1)Python基础教程(第2版)[电子版图书自行百度] 2)深入浅出Head First python(中文版)[电子版图书自行百度]

PPV课原创文章,转载请注明出处

原文发布于微信公众号 - PPV课数据科学社区(ppvke123)

原文发表时间:2016-05-21

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏PPV课数据科学社区

【译】你真的知道数据挖掘的秘密吗?

版权申明 作者:Jason Brownlee 原文链接:http://machinelearningmastery.com/what-is-data-mini...

3016
来自专栏AI科技评论

Facebook 所谓的“人工智能母体”FBLearner Flow 究竟是如何工作的?

Facebook昨天第一次正式介绍了FBLearner Flow,一个可以为全公司员工管理机器学习模型的机器学习软件。换句话说,这是一个可以自己制造人工智能的人...

6597
来自专栏机器之心

资源 | 横向对比5大开源语音识别工具包,CMU Sphinx最佳

选自svds 作者:Cindi Thompson 机器之心编译 参与:李泽南、Smith 目前开源世界里存在多种不同的语音识别工具包,它们为开发者构建应用提供了...

7476
来自专栏CSDN技术头条

从原理到策略算法再到架构产品看推荐系统 | 附Spark实践案例

作者 | HCY崇远 01 前言 本文源自于前阵子连续更新的推荐系统系列,前段时间给朋友整理一个关于推荐系统相关的知识教学体系,刚好自身业务中,预计明年初随着业...

74211
来自专栏媒矿工厂

Facebook VR方案总结(二)

前言 VR技术是目前最受关注的前沿科技之一,受到了各家互联网公司的青睐,但这并不是首次。实际上,VR在发展史上经历了三次热潮。第一次热潮发生在上个世纪60年代,...

56910
来自专栏PPV课数据科学社区

哪一种编程语言适合人工智能?——Python在人工智能中的作用

? 谷歌的AI击败了一位围棋大师,是一种衡量人工智能突然的快速发展的方式,也揭示了这些技术如何发展而来和将来可以如何发展。 人工智能是一种未来性的技术,目前正...

4196
来自专栏大数据文摘

[译]9个要点,打造引入注目的信息图

2466
来自专栏架构师之路

Google新一代智能验证码

Google新一代智能验证码 图灵测试 来自图灵的论文《计算机与智能》,该测试的内容是:如果计算机能在一定时间内回答由参与测试的人类提出的一系列问题,且其超过3...

4798
来自专栏大数据挖掘DT机器学习

数据挖掘工作的几点体会

1、挖掘工具主要分商业数据产品和集成数据挖掘产品两类:商业数据挖掘产品具有代表性的SPSS Clementine,SAS Enterprise Miner,IB...

3676
来自专栏AI研习社

干货!从基础到进阶,长文解析微软量子计算概念和算法(下)

在相对论中,消息会马上到达,但 Bob 不能真正地看信息,理解它,直到 Alice 向他发送另外两条经典的信息。如果将这两条经典信息加密,则需要将它们解码。经典...

873

扫码关注云+社区

领取腾讯云代金券