机器学习与数据挖掘网上资源搜罗——良心推荐

作者: 左飞

著有《算法之美——隐匿在数据结构背后的原理(C++版)》

原文 http://blog.csdn.net/baimafujinji/article/details/50467970

做机器学习和数据挖掘方面的研究和开发,常会在线搜索一些资源,日积月累便挖出了一堆比较牛的博主,特别说明:做这个方向的人很多,牛人也很多,但是这些资源大部分主要突出实用主义,相关博主也并不一定是这个领域中的泰山北斗(至少大部分都不是学校里的教授),但是他们的空间里真的有料,可以学到很多。不断更新中,但大浪淘沙,我只保留最值得推荐的。

1、首先,是豆瓣上的数据铺子主页

http://site.douban.com/182577/

因为我个人多是用R来做数据挖掘和分析,所以主页菌的内容很对我的胃口。这个主页里有大量用R做数据挖掘的内容。我也向博主偷师了很多。尽管主页菌已经停止更新内容了,但是现有的部分(其实文章量很大)已经可以令后来者学到很多了。

2、JerryLead在博客园上的主页

http://www.cnblogs.com/jerrylead/

如果你想了解数据挖掘算法的原理,而且是从数学层面上做到“知其然,更知其所以然”的深度理解,这个博客(以及下面的博客)理应是你必看的内容。这个主页的特点是对很多算法都做了详细的数学推导。博主应该是在中科院读博的,尽管博客似乎也停更很久了,但是很多经典的东西其实永不过时。SVM、EM等系列文章介绍的很到位,尤其推荐。

3、pluskid的主页

http://blog.pluskid.org/?page_id=683

博主是浙大本硕,后来貌似应该去了美国读博。这个博客跟JerryLead的很类似,大量数学推导,让你从本质上认识和理解很多晦涩的数据挖掘算法。网络上很多人推崇CSDN上的July,尤其是那篇SVM三重境界。殊不知,July的三重境界也不过是JerryLead和pluskid左一段右一段的移花接木之作罢了。最开始我看这几篇文章的时候,就发现内容像极了,尤其是pluskid画的图基本原模原样地出现在了July的文章中。后来在知乎上看了帖子http://www.zhihu.com/question/24957182,差不多也就明白里面的事了。总之,希望大家还是能够尊重原创吧。July的博客也可以看,毕竟超千万的访问量,他东搜西凑的不断整理没有功劳也有苦劳,大家可权当一个合集来看了。

4、龙心尘&寒小阳 的主页

http://blog.csdn.net/longxinchen_ml/

数据挖掘和机器学习博客中的新生力量,看了几篇博文,感觉实力不俗。神经网络和深度学习部分的内容比较推荐。

其他公共资源

R、Weka、Python和Matlab都是用来做数据挖掘的利器(甚至SPSS、STATA、SAS也能用来完成一些数据挖掘任务)。因此,事实上这些软件或语言的公共主页或论坛上也包含有大量不错的内容(包括一些程序代码和应用实例)。

最后,网上还有很多关于机器学习和数据挖掘的公开课。如果你想一点一点系统的学习,那么这些资源你都不应该错过。我主要推荐两个:

一个是斯坦福的公开课——机器学习 ,由Andrew Ng主讲。我相信JerryLead 的EM博文就参考了Andrew Ng的授课内容。这个课程是英文授课,国内网站的视频上还配了中文字幕,如果你有毅力和决心,那么啃这个课程是很不错的选择。国内可以访问网易公开课来学习,地址如下

http://open.163.com/special/opencourse/machinelearning.html

如果你还是觉得听英语很别扭,那么由台湾大学林轩田教授录制的中文Coursera课程(也就是传说中的MOOC)——机器学习系列就是一个绝佳的资源。该课程分上下两个部分,对于初学者可以学习——“机器学习基石”课程

http://c.open.163.com/coursera/courseIntro.htm?cid=938

听这个名字你也能知道上面的课程讲的是基础。如果你想学习进阶内容(当然,前提是基石部分的知识你已经统统掌握了),那么你便可以选择林教授的另外一门MOOC课程——“机器学习技法”课程

http://c.open.163.com/coursera/courseIntro.htm?cid=1664

补充一个不错的资源:由悉尼科技大学 徐亦达博士 录制的中文机器学习系列视频,讲解细致、通俗易懂:

http://v.youku.com/v_show/id_XMTM1MzQ1NDk5Ng==.html?from=y1.7-1.2

最后,你也可以持续关注我的博客 http://blog.csdn.net/baimafujinji,我也会利用闲暇时间多发布一些machine learning或者data mining方面的资料和笔记。

感谢上述资源提供者的无私奉献。也衷心希望各位读者学有所得,学有所成!

原文发布于微信公众号 - 大数据挖掘DT数据分析(datadw)

原文发表时间:2016-03-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

比谷歌快46倍!GPU助力IBM Snap ML,40亿样本训练模型仅需91.5 秒

【新智元导读】近日,IBM 宣布他们使用一组由 Criteo Labs发布的广告数据集来训练逻辑回归分类器,在POWER9服务器和GPU上运行自身机器学习库Sn...

35410
来自专栏程序人生 阅读快乐

算法设计与分析_算法导论(第二版)

本书在介绍算法时,重点介绍用干设计算法的策略.非常与众不同。书中介绍了剪枝搜索、分摊分析、随机算法、在线算法以及多项式近似方案等相对较新的思想和众多基于分摊分析...

381
来自专栏PaddlePaddle

从第一本书开始,如何成为深度学习工程师(上篇)

小编结合资料与工程师经验,梳理出一条深度学习工程师的成长路径及“练级大法”,希望可以帮到各位“炼丹师”稳步进阶,畅游深度学习海洋~

802
来自专栏量子位

机器学习概念太多记不住?别怕,这有一套手绘小卡片 | 资源

颜萌 李林 编译整理 量子位 出品 | 公众号 QbitAI 有很多种方法可以了解机器学习。你可以去听课,也可以看视频教程,甚至博客,知乎问答都可以是你的选择。...

3495
来自专栏目标检测和深度学习

TensorFlow AI 新品联手NVIDIA,支持Swift和JavaScript

整理 | 费棋 天体物理学家使用 TensorFlow 分析开普勒任务中的大量数据,以发现新的行星; 医学研究人员利用 TensorFlow 机器学习技术来评估...

2996
来自专栏华章科技

为什么你的数据分析那么好,图表做得那么烂?

所有优秀的数据可视化依赖优异的设计,并非仅仅选择正确的图表模板那么简单。全在于以一种更加有助于理解和引导的方式去表达信息,尽可能减轻用户获取信息的成本。当然并非...

832
来自专栏CVer

重磅:吴恩达最新的机器学习书籍《Machine Learning Yearning》

吴恩达在AI教育上,继《Machine Learning》和《Deep Learning Specialization》和和视频课程后,再出力作《Machine...

3647
来自专栏真皮专栏

Recommended System

推荐系统的核心问题就在于为用户推荐与其兴趣相似度比较高的商品。比如在微博上,用户至上想打发时间,并不是想准确的查看某条信息,在首页中查看每一条微博,为了帮助他筛...

862
来自专栏专知

【下载】深度学习DL4j实战指南《Deep Learning—A Practitioner's Approach》

【导读】 深度学习工程师、deeplearning4j框架贡献者之一Adam Gibson等人的新书《Deep Learning—A Practitioner'...

3964
来自专栏思影科技

静息态网络核心区域的动态连接的调制激活

来自哈佛医学院的Tang wei和Stufflebeam等人在PNAS上发文,主要介绍了其针对静息态网络核心区域的动态连接影响局部神经激活的研究。文...

3538

扫码关注云+社区