零基础学习Python数据挖掘

作者:聊聊数据分析和挖掘 https://www.zhuanlan.zhihu.com/p/25575805

Python已经稳坐机器学习的第一语言(机器学习编程语言之争,Python夺魁),尤其是深度学习框架Torch宣布支持Python之后。所以学习Python进行数据挖掘是性价比是最高的(本人也放弃了使用了3年多的R语言)。而使用Python进行数据挖掘是最近几年才开始火起来的,之前网上很多的资料都是关于Python网页开发等。但使用Python进行数据挖掘的侧重点已经完全不一样了。本人就是浪费了很多时间来筛选这些博客、书籍。所以就有了本文,希望能帮大家少走一点弯路。

本文章主要从数据挖掘的角度出发,谈谈如何入门数据挖掘。本文不能保证你能成为大神,但是如果能踏踏实实地学习完,找一份年薪15w+的工作还是不太难的,考虑到市场上人才的稀缺。本人也是非计算机专业,所以希望给非计算机的人一点参考。现在市场上数据挖掘的人才非常缺少,现在大一点的企业都需要数据分析、数据挖掘的人才,但是国目前只有3所大学开设了相关的本科专业,计算机专业的人也不会抢这饭碗,因而,造成了数据挖掘市场上人才的供给不足,所以给了一大堆非科班出身人很多的机会。

一、Python 基础语法学习

如果只推荐一本书,强烈推荐《跟老齐学Python》,Python中的核心概念做了非常棒的讲解,深刻而不失幽默。

如果想系统的学习推荐密歇根大学的《学习使用Python编程并分析数据》系列课程。

廖雪峰Python教程 简单易上手的Python基础语法教程,值得学习, Python 2和Python 3版本都有。

二、 机器学习理论

基本经典的机器学习书籍

机器学习入门(中/英)(谷歌大牛的课程)

机器学习(乔治亚理工大学计算机课程)

周志华的西瓜书《机器学习》

深入一些的可以考虑李航的《统计学习方法》

还有偏统计的斯坦福的教授写的《统计学习导论》,深入版本的《The Elements of Statistical Learning》(英文影印版)

上面推荐的都是非常不错机器学习的入门书籍,都是经典了。

三、Python机器学习代码学习

掌握Python语法的基础上学习《Python for data analysis》是比较不错的选择,涵盖了ipython notebook、Numpy、Scipy和Pandas包的使用。

《Python数据分析与挖掘实战》介绍了使用Python进行数据挖掘的详细案例,数据和代码都可以下载,作为机器学习的进阶学习是不错的选择(这本书也用对应的R语言和Matlab 版本)。

还有Udacity机器学习纳米学位项目代码(Github上有)

再推荐2本国外网站的书籍,还在early release阶段《Python Data Science Handbook》和《Hands On Machine Learning with Scikit-Learn and TensorFlow》,非常好的代码示范。注册Safari Online,可以免费看10天。

四、优秀博客和微信公众号

我推荐的网站和微信公众号都是我平时天天看的,那些水货大多被我取消关注了,养成每周清理公众号的好习惯。

1. 数据挖掘入门与实战 全是干货,代码质量非常高。

2. 机器学习研究会 我校老师组织的学习平台,代码加行业信息齐飞,质量非常高。尤其是我校的AI公开课(有直播),中国顶尖人工智能大腕云集。

3. 新智元 人工智能方向行业观点,对于自己把握技术方向非常重要,比如说自动驾驶这个坑能不能入?

4. 机器之心 技术前沿与重量级新闻。

还有一些其他的,下次再继续补充。

还有几个博客:

iPhone上可以使用Reeder阅读器,Instapaper用来保存后稍后阅读,因为信息量比较大。

No free Hunch Kaggle竞赛平台的官方博客,包括一些优秀的代码解读以及高分选手的采访,十分有用的经验(来自不同背景,不同年龄层次,不同职业的选手)

Analytics Community | Analytics Discussions | Big Data Discussion 干货技术文章

新浪微博-爱可可 (北邮PRIS模式识别实验室陈老师)

五、计算机书籍下载网站

再添加几个外文书籍下载网址:

1. All IT eBooks 全,可能需要使用翻*墙下载,翻*墙方法见文末

2. Library Genesis 各种书籍,不局限于编程书籍

3. Fox eBook - eBooks Free Download Site

4. Development / Programming / AvaxHome

原文发布于微信公众号 - 马哥Linux运维(magedu-Linux)

原文发表时间:2017-05-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数据的力量

数据分析那些事(菜鸟入门必看)

3415
来自专栏熊二哥

项目管理深入理解03--质量管理

质量管理一章内容非常驳杂,而且不太好理解,不愧为可以单独成书的一部分内容,尤其其中涉及的质量管理方法非常的多,抓住重点才能学习好这一章节。 ? 项目质量管理实...

1918
来自专栏Web行业观察

关于产品那些事

上面是 Urban Dictionary 对 Badass 的英文解释,非常到位。Badass = bad + ass,bad 是“坏的”,ass 是“屁股、愚...

1084
来自专栏PPV课数据科学社区

【知识】为什么R是你下一个要学的编程语言?

对于那些对R语言还不熟悉的朋友,我先来做一个简单的介绍。首先,R是非常吸引人的一门语言。如今它已成为求职简历上让人眼前一亮的一门技能,部分原因是R语言的使用人数...

3439
来自专栏大数据文摘

从产品设计到虚拟现实:Google虚拟现实团队设计师和你聊VR

2074
来自专栏CDA数据分析师

Google数字营销布道师Avinash Kaushik:如何用数据分析闭环引爆百亿美金公司订单3倍增长?

最近读了谷歌数字营销布道师 Avinash Kaushik (他同时也是畅销书 Web Analytics 2.0 作者)写的:The Lean Analyti...

2406
来自专栏CSDN技术头条

Facebook创建新开源组织TODO,Google、Twitter等继续捧场

继WebScaleSQL后,Facebook继续加大在开源界的投入。在本周一的旧金山的@Scale会议上,Facebook宣布了两项开源领域的努力——用以帮助公...

1635
来自专栏速成应用小程序开发平台

搭建微信小程序套用模板、可视化拖拽制作还是选择定制开发?

自小程序2017年1月9号正式上线以来,不论是中小商家,还是各大品牌巨头,都在抢占小程序这波风口,打造属于自己的小程序。截至目前,全国正式上线小程序超过150万...

5482
来自专栏AI科技大本营的专栏

4个关于Python编程语言的故事

今天要讲 4 个关于 Python 编程语言的故事,来看看人工智能时代爆发的 Python。

1531
来自专栏新智元

《福布斯》:谷歌能从开源生态系统中获得什么?

【新智元导读】《福布斯》日前刊文,记者深入谷歌,探明其开源以TensorFlow为代表的一系列核心技术原因:开源能够更好更快地改善技术,同时也能够让自己成为价值...

3435

扫码关注云+社区

领取腾讯云代金券