机器学习与数据挖掘网上资源搜罗——良心推荐

作者: 左飞

著有《算法之美——隐匿在数据结构背后的原理(C++版)》

原文 http://blog.csdn.net/baimafujinji/article/details/50467970

做机器学习和数据挖掘方面的研究和开发,常会在线搜索一些资源,日积月累便挖出了一堆比较牛的博主,特别说明:做这个方向的人很多,牛人也很多,但是这些资源大部分主要突出实用主义,相关博主也并不一定是这个领域中的泰山北斗(至少大部分都不是学校里的教授),但是他们的空间里真的有料,可以学到很多。不断更新中,但大浪淘沙,我只保留最值得推荐的。

1、首先,是豆瓣上的数据铺子主页

http://site.douban.com/182577/

因为我个人多是用R来做数据挖掘和分析,所以主页菌的内容很对我的胃口。这个主页里有大量用R做数据挖掘的内容。我也向博主偷师了很多。尽管主页菌已经停止更新内容了,但是现有的部分(其实文章量很大)已经可以令后来者学到很多了。

2、JerryLead在博客园上的主页

http://www.cnblogs.com/jerrylead/

如果你想了解数据挖掘算法的原理,而且是从数学层面上做到“知其然,更知其所以然”的深度理解,这个博客(以及下面的博客)理应是你必看的内容。这个主页的特点是对很多算法都做了详细的数学推导。博主应该是在中科院读博的,尽管博客似乎也停更很久了,但是很多经典的东西其实永不过时。SVM、EM等系列文章介绍的很到位,尤其推荐。

3、pluskid的主页

http://blog.pluskid.org/?page_id=683

博主是浙大本硕,后来貌似应该去了美国读博。这个博客跟JerryLead的很类似,大量数学推导,让你从本质上认识和理解很多晦涩的数据挖掘算法。网络上很多人推崇CSDN上的July,尤其是那篇SVM三重境界。殊不知,July的三重境界也不过是JerryLead和pluskid左一段右一段的移花接木之作罢了。最开始我看这几篇文章的时候,就发现内容像极了,尤其是pluskid画的图基本原模原样地出现在了July的文章中。后来在知乎上看了帖子http://www.zhihu.com/question/24957182,差不多也就明白里面的事了。总之,希望大家还是能够尊重原创吧。July的博客也可以看,毕竟超千万的访问量,他东搜西凑的不断整理没有功劳也有苦劳,大家可权当一个合集来看了。

4、龙心尘&寒小阳 的主页

http://blog.csdn.net/longxinchen_ml/

数据挖掘和机器学习博客中的新生力量,看了几篇博文,感觉实力不俗。神经网络和深度学习部分的内容比较推荐。

其他公共资源

R、Weka、Python和Matlab都是用来做数据挖掘的利器(甚至SPSS、STATA、SAS也能用来完成一些数据挖掘任务)。因此,事实上这些软件或语言的公共主页或论坛上也包含有大量不错的内容(包括一些程序代码和应用实例)。

最后,网上还有很多关于机器学习和数据挖掘的公开课。如果你想一点一点系统的学习,那么这些资源你都不应该错过。我主要推荐两个:

一个是斯坦福的公开课——机器学习 ,由Andrew Ng主讲。我相信JerryLead 的EM博文就参考了Andrew Ng的授课内容。这个课程是英文授课,国内网站的视频上还配了中文字幕,如果你有毅力和决心,那么啃这个课程是很不错的选择。国内可以访问网易公开课来学习,地址如下

http://open.163.com/special/opencourse/machinelearning.html

如果你还是觉得听英语很别扭,那么由台湾大学林轩田教授录制的中文Coursera课程(也就是传说中的MOOC)——机器学习系列就是一个绝佳的资源。该课程分上下两个部分,对于初学者可以学习——“机器学习基石”课程

http://c.open.163.com/coursera/courseIntro.htm?cid=938

听这个名字你也能知道上面的课程讲的是基础。如果你想学习进阶内容(当然,前提是基石部分的知识你已经统统掌握了),那么你便可以选择林教授的另外一门MOOC课程——“机器学习技法”课程

http://c.open.163.com/coursera/courseIntro.htm?cid=1664

补充一个不错的资源:由悉尼科技大学 徐亦达博士 录制的中文机器学习系列视频,讲解细致、通俗易懂:

http://v.youku.com/v_show/id_XMTM1MzQ1NDk5Ng==.html?from=y1.7-1.2

最后,你也可以持续关注我的博客 http://blog.csdn.net/baimafujinji,我也会利用闲暇时间多发布一些machine learning或者data mining方面的资料和笔记。

感谢上述资源提供者的无私奉献。也衷心希望各位读者学有所得,学有所成!

原文发布于微信公众号 - 大数据挖掘DT数据分析(datadw)

原文发表时间:2016-03-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据文摘

儿童节 | 别只教小朋友编程,传授算法的智慧给他们同样重要

1736
来自专栏量子位

通过图灵测试!Google掌舵人说“打电话AI”是一次非凡突破

今天凌晨,Google I/O 2018大会最后一日,前不久刚刚获得年度图灵奖的Alphabet新任董事长John Hennessy登上舞台。

1253
来自专栏新智元

Jeff Dean力荐!牛津美女博士分享:读博士前要了解的20件事

近日,机器学习大牛、谷歌AI总负责人Jeff Dean发推转帖,推荐了一篇刚毕业的博士生写的文章,内容与技术无关,而是关于攻读博士学位时需要注意的一些小tip。...

1075
来自专栏量子位

全程中文!谷歌发布机器学习速成课,完全免费(附视听评测)

全球AI第一大厂Google推了新课程! ? Google今天上线了一个“机器学习速成课程”,英文简称MLCC。用他们自己的话来形容,这个课程节奏紧凑、内容实用...

3725
来自专栏华章科技

天龙八部:一张图告诉你如何8步炼成数据科学家

OK,这条道路确实不是无迹可寻的。虽然并不简单,但是,通过科学的规划和足够的时间投入,数据科学家可以通过很少的花费炼成。

972
来自专栏AI科技评论

开发丨数据整理太繁琐?MIT 发布能化零为整的分析系统

2016年美国CrowdFlower公司从业内80位数据科学家那里得到的调查结果显示,他们平均花费在数据收集和整理上的时间占到整个数据分析过程的80%,而只有余...

3508
来自专栏人工智能头条

谷歌Principal Scientist谈AI:知识表示为何重要

1974
来自专栏大数据文摘

情感机器:人类的19大思维方式

36316
来自专栏腾讯社交用户体验设计

QQ默认表情优化背后的故事 - 腾讯ISUX

1995
来自专栏AI科技大本营的专栏

华为推CPU Turbo,荣耀Note10突破3000档

继 GPU Turbo 之后,华为又借着大屏手机荣耀 Note10,推出了一项很“吓人”的技术—— CPU Turbo。

1061

扫码关注云+社区

领取腾讯云代金券