机器学习与数据挖掘网上资源搜罗——良心推荐

作者: 左飞

著有《算法之美——隐匿在数据结构背后的原理(C++版)》

原文 http://blog.csdn.net/baimafujinji/article/details/50467970

做机器学习和数据挖掘方面的研究和开发,常会在线搜索一些资源,日积月累便挖出了一堆比较牛的博主,特别说明:做这个方向的人很多,牛人也很多,但是这些资源大部分主要突出实用主义,相关博主也并不一定是这个领域中的泰山北斗(至少大部分都不是学校里的教授),但是他们的空间里真的有料,可以学到很多。不断更新中,但大浪淘沙,我只保留最值得推荐的。

1、首先,是豆瓣上的数据铺子主页

http://site.douban.com/182577/

因为我个人多是用R来做数据挖掘和分析,所以主页菌的内容很对我的胃口。这个主页里有大量用R做数据挖掘的内容。我也向博主偷师了很多。尽管主页菌已经停止更新内容了,但是现有的部分(其实文章量很大)已经可以令后来者学到很多了。

2、JerryLead在博客园上的主页

http://www.cnblogs.com/jerrylead/

如果你想了解数据挖掘算法的原理,而且是从数学层面上做到“知其然,更知其所以然”的深度理解,这个博客(以及下面的博客)理应是你必看的内容。这个主页的特点是对很多算法都做了详细的数学推导。博主应该是在中科院读博的,尽管博客似乎也停更很久了,但是很多经典的东西其实永不过时。SVM、EM等系列文章介绍的很到位,尤其推荐。

3、pluskid的主页

http://blog.pluskid.org/?page_id=683

博主是浙大本硕,后来貌似应该去了美国读博。这个博客跟JerryLead的很类似,大量数学推导,让你从本质上认识和理解很多晦涩的数据挖掘算法。网络上很多人推崇CSDN上的July,尤其是那篇SVM三重境界。殊不知,July的三重境界也不过是JerryLead和pluskid左一段右一段的移花接木之作罢了。最开始我看这几篇文章的时候,就发现内容像极了,尤其是pluskid画的图基本原模原样地出现在了July的文章中。后来在知乎上看了帖子http://www.zhihu.com/question/24957182,差不多也就明白里面的事了。总之,希望大家还是能够尊重原创吧。July的博客也可以看,毕竟超千万的访问量,他东搜西凑的不断整理没有功劳也有苦劳,大家可权当一个合集来看了。

4、龙心尘&寒小阳 的主页

http://blog.csdn.net/longxinchen_ml/

数据挖掘和机器学习博客中的新生力量,看了几篇博文,感觉实力不俗。神经网络和深度学习部分的内容比较推荐。

其他公共资源

R、Weka、Python和Matlab都是用来做数据挖掘的利器(甚至SPSS、STATA、SAS也能用来完成一些数据挖掘任务)。因此,事实上这些软件或语言的公共主页或论坛上也包含有大量不错的内容(包括一些程序代码和应用实例)。

最后,网上还有很多关于机器学习和数据挖掘的公开课。如果你想一点一点系统的学习,那么这些资源你都不应该错过。我主要推荐两个:

一个是斯坦福的公开课——机器学习 ,由Andrew Ng主讲。我相信JerryLead 的EM博文就参考了Andrew Ng的授课内容。这个课程是英文授课,国内网站的视频上还配了中文字幕,如果你有毅力和决心,那么啃这个课程是很不错的选择。国内可以访问网易公开课来学习,地址如下

http://open.163.com/special/opencourse/machinelearning.html

如果你还是觉得听英语很别扭,那么由台湾大学林轩田教授录制的中文Coursera课程(也就是传说中的MOOC)——机器学习系列就是一个绝佳的资源。该课程分上下两个部分,对于初学者可以学习——“机器学习基石”课程

http://c.open.163.com/coursera/courseIntro.htm?cid=938

听这个名字你也能知道上面的课程讲的是基础。如果你想学习进阶内容(当然,前提是基石部分的知识你已经统统掌握了),那么你便可以选择林教授的另外一门MOOC课程——“机器学习技法”课程

http://c.open.163.com/coursera/courseIntro.htm?cid=1664

补充一个不错的资源:由悉尼科技大学 徐亦达博士 录制的中文机器学习系列视频,讲解细致、通俗易懂:

http://v.youku.com/v_show/id_XMTM1MzQ1NDk5Ng==.html?from=y1.7-1.2

最后,你也可以持续关注我的博客 http://blog.csdn.net/baimafujinji,我也会利用闲暇时间多发布一些machine learning或者data mining方面的资料和笔记。

感谢上述资源提供者的无私奉献。也衷心希望各位读者学有所得,学有所成!

原文发布于微信公众号 - 大数据挖掘DT数据分析(datadw)

原文发表时间:2016-03-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏腾讯社交用户体验设计

QQ默认表情优化背后的故事 - 腾讯ISUX

1755
来自专栏量子位

全程中文!谷歌发布机器学习速成课,完全免费(附视听评测)

全球AI第一大厂Google推了新课程! ? Google今天上线了一个“机器学习速成课程”,英文简称MLCC。用他们自己的话来形容,这个课程节奏紧凑、内容实用...

3545
来自专栏人工智能头条

谷歌Principal Scientist谈AI:知识表示为何重要

1844
来自专栏量子位

通过图灵测试!Google掌舵人说“打电话AI”是一次非凡突破

今天凌晨,Google I/O 2018大会最后一日,前不久刚刚获得年度图灵奖的Alphabet新任董事长John Hennessy登上舞台。

1093
来自专栏数据的力量

【分析工具介绍】工欲善其事必先利其器

1696
来自专栏PPV课数据科学社区

天龙八部:一张图告诉你如何8步炼成数据科学家

如何成为一个数据科学家?不少刚刚接触这个领域的探索者都在寻找一条尽可能正确的道路。 OK, 这条道路确实不是无迹可寻的。虽然并不简单,但是,通过科学的规划和足...

34312
来自专栏新智元

Jeff Dean力荐!牛津美女博士分享:读博士前要了解的20件事

近日,机器学习大牛、谷歌AI总负责人Jeff Dean发推转帖,推荐了一篇刚毕业的博士生写的文章,内容与技术无关,而是关于攻读博士学位时需要注意的一些小tip。...

905
来自专栏DT数据侠

数据圈最残酷真相即将浮出水面

开篇提示:即便你不喜欢DT君今天的瞎bb,也务必坚持到文末惊喜处,这不是愚人节玩笑!

790
来自专栏大数据文摘

天龙八部:一张图告诉你如何8步炼成数据科学家

1201
来自专栏DT数据侠

星巴克玫瑰图终极解密:数据可视化的原子设计方法论

DT君前阵子写了一篇《公司楼下竟然没有星巴克,你想过为什么吗?》,里面有一张玫瑰图引来了数据可视化技术大牛们的推演还原,比如之前数据侠杜雨的《DT君的星巴克门店...

940

扫码关注云+社区