机器学习与数据挖掘网上资源搜罗——良心推荐

作者: 左飞

著有《算法之美——隐匿在数据结构背后的原理(C++版)》

原文 http://blog.csdn.net/baimafujinji/article/details/50467970

做机器学习和数据挖掘方面的研究和开发,常会在线搜索一些资源,日积月累便挖出了一堆比较牛的博主,特别说明:做这个方向的人很多,牛人也很多,但是这些资源大部分主要突出实用主义,相关博主也并不一定是这个领域中的泰山北斗(至少大部分都不是学校里的教授),但是他们的空间里真的有料,可以学到很多。不断更新中,但大浪淘沙,我只保留最值得推荐的。

1、首先,是豆瓣上的数据铺子主页

http://site.douban.com/182577/

因为我个人多是用R来做数据挖掘和分析,所以主页菌的内容很对我的胃口。这个主页里有大量用R做数据挖掘的内容。我也向博主偷师了很多。尽管主页菌已经停止更新内容了,但是现有的部分(其实文章量很大)已经可以令后来者学到很多了。

2、JerryLead在博客园上的主页

http://www.cnblogs.com/jerrylead/

如果你想了解数据挖掘算法的原理,而且是从数学层面上做到“知其然,更知其所以然”的深度理解,这个博客(以及下面的博客)理应是你必看的内容。这个主页的特点是对很多算法都做了详细的数学推导。博主应该是在中科院读博的,尽管博客似乎也停更很久了,但是很多经典的东西其实永不过时。SVM、EM等系列文章介绍的很到位,尤其推荐。

3、pluskid的主页

http://blog.pluskid.org/?page_id=683

博主是浙大本硕,后来貌似应该去了美国读博。这个博客跟JerryLead的很类似,大量数学推导,让你从本质上认识和理解很多晦涩的数据挖掘算法。网络上很多人推崇CSDN上的July,尤其是那篇SVM三重境界。殊不知,July的三重境界也不过是JerryLead和pluskid左一段右一段的移花接木之作罢了。最开始我看这几篇文章的时候,就发现内容像极了,尤其是pluskid画的图基本原模原样地出现在了July的文章中。后来在知乎上看了帖子http://www.zhihu.com/question/24957182,差不多也就明白里面的事了。总之,希望大家还是能够尊重原创吧。July的博客也可以看,毕竟超千万的访问量,他东搜西凑的不断整理没有功劳也有苦劳,大家可权当一个合集来看了。

4、龙心尘&寒小阳 的主页

http://blog.csdn.net/longxinchen_ml/

数据挖掘和机器学习博客中的新生力量,看了几篇博文,感觉实力不俗。神经网络和深度学习部分的内容比较推荐。

其他公共资源

R、Weka、Python和Matlab都是用来做数据挖掘的利器(甚至SPSS、STATA、SAS也能用来完成一些数据挖掘任务)。因此,事实上这些软件或语言的公共主页或论坛上也包含有大量不错的内容(包括一些程序代码和应用实例)。

最后,网上还有很多关于机器学习和数据挖掘的公开课。如果你想一点一点系统的学习,那么这些资源你都不应该错过。我主要推荐两个:

一个是斯坦福的公开课——机器学习 ,由Andrew Ng主讲。我相信JerryLead 的EM博文就参考了Andrew Ng的授课内容。这个课程是英文授课,国内网站的视频上还配了中文字幕,如果你有毅力和决心,那么啃这个课程是很不错的选择。国内可以访问网易公开课来学习,地址如下

http://open.163.com/special/opencourse/machinelearning.html

如果你还是觉得听英语很别扭,那么由台湾大学林轩田教授录制的中文Coursera课程(也就是传说中的MOOC)——机器学习系列就是一个绝佳的资源。该课程分上下两个部分,对于初学者可以学习——“机器学习基石”课程

http://c.open.163.com/coursera/courseIntro.htm?cid=938

听这个名字你也能知道上面的课程讲的是基础。如果你想学习进阶内容(当然,前提是基石部分的知识你已经统统掌握了),那么你便可以选择林教授的另外一门MOOC课程——“机器学习技法”课程

http://c.open.163.com/coursera/courseIntro.htm?cid=1664

补充一个不错的资源:由悉尼科技大学 徐亦达博士 录制的中文机器学习系列视频,讲解细致、通俗易懂:

http://v.youku.com/v_show/id_XMTM1MzQ1NDk5Ng==.html?from=y1.7-1.2

最后,你也可以持续关注我的博客 http://blog.csdn.net/baimafujinji,我也会利用闲暇时间多发布一些machine learning或者data mining方面的资料和笔记。

感谢上述资源提供者的无私奉献。也衷心希望各位读者学有所得,学有所成!

原文发布于微信公众号 - 大数据挖掘DT数据分析(datadw)

原文发表时间:2016-03-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏wOw的Android小站

[闲谈] 有经验的程序员用Google用得多么?

关于程序员有没有必要记一些API什么的讨论有很多,我个人觉得能Google到的就没必要刻意去记,可以简单的做个笔记,需要用的时候查一下就好了。真正有必要记的东西...

202
来自专栏ATYUN订阅号

机器学习可以通过风格确定代码背后的程序员

自动化工具现在可以准确地识别论坛帖子的作者,只要他们有足够的训练数据可供使用。但是较新的研究表明,这也可以应用于人工语言样本,如代码。事实证明,软件开发人员也留...

612
来自专栏CSDN技术头条

大脑记忆的建模

据国外媒体报道,科学家近日发现了大脑形成及失去记忆背后的数学方程。他们认为,这些方程可以精确地描述我们唤起回忆的方式。未来某一天,这一发现或许能帮助医生消除或改...

1778
来自专栏量子位

英特尔推出自然语言处理开源库,代号“NLP Architect”

几天前,英特尔宣布推出开源库NLP Architect——这是一个用于自然语言处理(NLP)的库,帮助开发人员为聊天机器人和虚拟助手等会话应用提供所必需的功能,...

833
来自专栏点滴积累

一个程序员的思考

读书笔记系列链接地址http://www.cnblogs.com/shoufengwei/p/5714661.html。        最近被一件事情虐的不行...

3325
来自专栏玉树芝兰

如何高效读论文?

(由于微信公众号外部链接的限制,文中的部分链接可能无法正确打开。如有需要,请点击文末的“阅读原文”按钮,访问可以正常显示外链的版本。)

791
来自专栏WOLFRAM

用 Wolfram 语言发掘数学殿堂中的瑰宝

1397
来自专栏量子位

当,程序员突然想画画,AI+机器人就该登场了

但,理想和现实之间,可能远隔千山。比方,你其实没有创作的灵感。以及,你其实没有把灵感实现出来的基本技能。

623
来自专栏玉树芝兰

如何快速写作论文初稿?

(由于微信公众号外部链接的限制,文中的部分链接可能无法正确打开。如有需要,请点击文末的“阅读原文”按钮,访问可以正常显示外链的版本。)

571
来自专栏CDA数据分析师

你喜欢什么歌?算法或许能预测

披头士乐队(Beatles)的骨灰级粉丝当然能够详细说出披头士在八年间音乐风格的变化。而现在,科学家开发了新的算法,借助数学方法和计算机技术来分析歌曲或者专辑之...

1757

扫描关注云+社区