【数据科学】9个针对初学者的数据科学公开课

如果你想自学,网络是一个非常好的地方,这里有太多的资源,有大神 Devendra Desale就挑选出了网络公开课中优秀的数据科学课程推荐给大家。

关于这些课程的指导方针:

  • 你需要考虑到需要的条件,决定所需的学时和持续时间看是否适合自己。
  • 所有课程是基于有统计学背景的假设上。
  • 有些课程中需要编程语言或者软件工具当做工具。

The Analytics Edge (麻省理工学院)

水平: Beginners-Expert

学时: 10 - 15小时/周

状态: Archived

持续时间: 12周

需要的条件: 无

工具: R

这是用R来学习数据分析的最好课程。课程提供基于一些业务案例的专题和大量的练习。这个课程对学习时间要求很严格,但是绝对值得。案例包括《点球成金》、eHarmony、弗雷明汉心脏研究,Twitter,IBM Watson和Netflix。通过这些例子,我们会教你以下分析方法:线性回归,逻辑回归,各种树、文本分析、集群化、可视化和优化组合。

地址:https://www.edx.org/course/analytics-edge-mitx-15-071x-0

机器学习 (斯坦福大学)

水平: Beginners-Expert

学时: 7 - 12小时/周

状态: On-demand

持续时间: 11周

需要的条件: 编程

工具: Octave

当你在网络上接触关于机器学习的课程,一定有这个课程视频。它由机器学习领域最好的教授之一Andrew Ng.讲授,完整的课程涵盖了所有机器学习的核心概念。

包括:(1)监督学习(参数或非参数算法,支持向量机,内核,神经网络)。 (2)无监督学习(集群、降维、推荐系统、深入学习)。(3) 机器学习的最佳实践(偏差/方差理论,在机器学习和人工智能方面的创新过程)。

https://www.coursera.org/learn/machine-learning/home/info

数据科学和机器学习要领(微软)

水平: Beginners-Intermediate

学时: 3 - 4小时/周

状态: On-demand

持续时间: 5周

需要的条件: 无

工具: R

这个课程是MIT专家和微软合作的,帮你学习数据科学以更好地应用于职场。本课程结束时,你就会知道如何用数据科学和机器学习模型来构建和获得见解。你将通过Azure 机器学习, R & Python来构建一个云数据解决方案的案例来学习数据采集、准备、探索和可视化方面的关键概念

https://www.edx.org/course/data-science-machine-learning-essentials-microsoft-dat203x

数据库 (斯坦福大学)

水平: 初学者

学时: 8 - 10小时/周

状态:Self-paced

持续时间: 10周

需要的条件: 无

工具: SQL、XML查询

如果你要处理数据,数据库是不可避免的。本课程涵盖了数据库设计和数据库管理系统应用程序的使用。它包括广泛覆盖的关系模型,包含XML数据,DTDs模板、XML模板的内容,同时包含查询和转换语言XPath,Xquery和XSLT的内容。课程包括UML中的数据库设计,基于依赖关系和正常形式的相关设计原则。

https://lagunita.stanford.edu/courses/Home/Databases/Engineering/about

编码矩阵:线性代数在计算机科学的应用 (布朗大学)

水平: Beginner-Intermediate

学时: 10 - 14小时/周

状态: Archived

持续时间: 10周

需要的条件: 无

工具: Python

线性代数不仅是计算机科学的重要组成,而且机器学习、图形和统计数据都需要。这是一个杰出的课程,将指导你完成真正的案例和python任务。你需要编写程序实现基本矩阵和向量的功能和算法,并使用这些实现任务:二维图形变换、脸变形、人脸检测、图像转换、模糊和边缘检测、图像视角移除、分类肿瘤恶性或良性、整数分解、纠错编码和秘密共享。另一个更基础的课程是德克萨斯奥斯丁大学的LAFF。

https://www.coursera.org/course/matrix

学习数据 (加州理工学院)

水平: Intermediate-Expert

学时: 10 - 14小时/周

状态: Archived

持续时间: 10周

需要的条件: 概率矩阵,微积分

工具: 没有限制

对机器学习爱好者来说这是有史以来最好的公开课。这是机器的学习入门课程(ML),覆盖基本理论、算法和应用程序,但是需要一个有良好的线性代数,微积分和概率背景以及编程技能。教授这门课的是Yaser S.Abu-Mostafa ,他是加州理工学院电气工程和计算机科学教授,不仅是亚马逊里机器学习的畅销书的作者,也是一个会简化学习方法的教授。

http://work.caltech.edu/telecourse.html

CSCI E-109 Data Science(哈佛扩展学校)

水平: Beginners-Expert

学时: 7 - 12小时/周

状态: Archived

持续时间: 16周

需要的条件: 无

工具: Python,d3

非常优秀的课程。本课程介绍五个关键方面的调查方法: 通过data wrangling,清洗和采样得到合适的数据集;数据管理能够快速、可靠访问大数据;探索性数据分析生成假说;基于统计方法如回归和分类来预测;通过可视化、故事和易理解的总结来和他人沟通。

http://cs109.github.io/2015/

数据科学概论 (华盛顿大学)

水平: Beginner-Intermediate

学时: 10 - 14小时/周

状态: Archived

持续时间: 10周

需要的条件: 编程

工具: Python,R,SQL

介绍数据科学的基础知识,通过实践经验从大数据中提取价值。本课程教你一些数据科学的基本技术,包括SQL和NoSQL大规模数据管理解决方案(例如 MapReduce和时代),数据挖掘算法(如聚类和关联规则挖掘)和基本统计建模(例如线性和非线性回归)。

https://www.coursera.org/course/datasci

网络、人群和市场 (康奈尔大学)

水平: Beginners-Expert

学时: 4 - 8小时/周

状态: Archived

持续时间: 10周

需要的条件: 无

工具: 无

这项课程将通过研究社会、经济和技术在世界上是如何连接的基本问题的探索现代生活的相互联系。学生将探索博弈论,互联网结构,社会传播,社会力量传播的普及,信息瀑布。链接分析的另一个重要的知识来源是SNAP。

https://www.edx.org/course/networks-crowds-markets-cornellx-info2040x#%21

数据分析: Take It to the MAX() (DelftX)

水平: Intermediate

学时: 4 - 6小时/周

状态: On-demand

持续时间: 8周

需要的条件:基本的电子表格。

工具: MS-excel,python

即使在大数据时代,有大量的数据分析师还是严重依赖于电子表格收集意见。对于那些想要使用excel增强分析能力的人这是一个优秀的课程。你将深入探究电子表格数据分析:数据透视表,VLOOKUPS,Named ranges,what-if分析,并做出图形——这些将在第一周的课程中讲授。之后,你将学习的电子表格模型的质量,尤其是如何确保您的电子表格保持无差错和强大。最后,你还需要学习Python编程语言,帮助我们分析和操作电子表格中的数据。

https://www.edx.org/course/data-analysis-take-it-max-delftx-ex101x

如果你看到其他优秀的课程,请告诉我们和我们交流。

原文链接:http://www.kdnuggets.com/2015/09/top-20-data-science-moocs.htm

原文发布于微信公众号 - 数据科学与人工智能(DS_AI_shujuren)

原文发表时间:2015-10-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

专访 | Gamma Lab:让机器回答一个自然语言问题需要几步?

人类从一百二十万年前就开始制造机器了。阿基米德的杠杆给了我们力量,伽利略与达芬奇的动力学给了我们速度与空间,而计算机科学将取之不尽的信息从广阔的世界里吸收过来呈...

17120
来自专栏媒矿工厂

视频体验评估标准(uVES1.0)模型及算法解读

视频业务快速发展,已经从强调用户规模走向注重提升服务品质的阶段。消费者对观看体验的要求不断提高,提升视频用户体验质量已经成为视频服务的主要竞争因素。

86900
来自专栏大数据文摘

利用Python进行深度学习的完整入门指南(附资源)

26570
来自专栏CVer

机器学习&深度学习网站资源汇总

今天推荐一个超NB的开源项目mlhub123,我自以为自己收集的"黑科技"已经够多够全了,但直接看到mlhub123,哈哈,自惭形秽。

29610
来自专栏IT大咖说

大老师的前生——AlphaMao项目的回顾和总结

内容来源:基于深度学习的电竞数据分析——阵容对抗和赛况评估,来看看VPGAME美国团队的研究成果分享。IT 大咖说经授权发布。

14440
来自专栏AI研习社

Facebook 开源 FAISS;MIT 开发机器学习数据合成系统 SDV | 开发者头条

更高效的聚类、相似性搜索算法库,Facebook 开源 FAISS MIT 黑科技,合成数据也能用于机器学习 机器学习算法成功预测人造地震 每日推荐阅读 Vi...

35440
来自专栏人工智能快报

德科学家发现新的神经网络学习方法

沙沙响动的树叶,吱吱作响的树枝:对老鼠来说,这些感觉看起来是无害的,但如果有一只猫突然从灌木丛窜出来就不同了。在这种情况下,这些现象就变成了能够提示迫在眉睫的生...

32130
来自专栏AI科技评论

Andrej Karpathy发文谈神经网络:这不仅仅是分类器,这是一种新的软件开发思想

AI科技评论按:有越来越多的传统编程语言(C、C++、Java)等程序员开始学习机器学习/深度学习,而对机器学习/深度学习的研究人员来说,编程也是必备技巧。那么...

33050
来自专栏大数据挖掘DT机器学习

Slope one:简单高效的推荐算法

推荐系统最早在亚马逊的网站上应用,根据以往用户的购买行为,推荐出购买某种产品同时可能购买的其他产品,国内做的不错的当当网,有时候买书,它总能给我推荐出我感兴趣的...

34960
来自专栏PPV课数据科学社区

机器学习项目中常见的误区

在最近的一次报告中,Ben Hamner向我们介绍了他和他的同事在Kaggle比赛中看到的一些机器学习项目的常见误区。 这个报告于2014年2月在Strate举...

34360

扫码关注云+社区

领取腾讯云代金券