优质数据科学课程推荐:总结篇

原作者   David Venturi

编译 CDA 编译团队

本文为  CDA 数据分析师原创作品,转载需授权

一年以前,我还只是一个没有任何编程经验的技术宅。在试着上了一些在线课程之后,我深受启发,接着决定开始学习加拿大最好的计算机科学课程之一。

两周后,我意识到我可以通过 edX ,Coursera 和 Udacity 来学习我需要的一切知识,并且更快、更有效、成本更低。所以我退学了。

在不久之后,我开始通过使用在线课程创建自己专属的数据科学硕士学位。并且制定了一份数据科学编程方向的课程清单,其中很多课程我已经上过,其他课程均根据网站评分和评论等进行了筛选。

对于该系列的第一篇,我为数据科学初学者推荐了一些编程课程(想学习数据科学?我们整理了一份优质编程入门课程清单)。接着是统计和概率类课程(数据科学优质课程推荐#2:统计入门课程篇)。然后是数据科学导论,以及数据可视化课程。机器学习是第五个篇课题推荐。本篇是该系列的总结篇。

以下是对之前所有课程推荐的总结,以及其他13个补充主题

对于本系列的其他课程推荐,每一个我都花了几个小时找寻有关该主题的所以每个在线课程,并从其大纲和评论中提取关键信息,结合课程评分。我的目标是推荐每个主题的三个最优课程。

关于13个补充主题(如数据库,大数据和通用软件工程)没有足够的课程。但是在过去的八个月里,我搜集了尽可能多的该类课程。同时也补充了可能错过的课程。

除了开源的 Class Central 社区和它数以千计的课程评分及评论的数据库,我没有借助其他任何帮助。

自 2011 年以来, Class Central 的创始人 Dhawal Shah 一直密切的关注着在线课程。 在 Dhawal 的帮助下,我列出了这份课程清单。

如何选择课程

该系列每个课程指南中的课程必须符合一些标准。除去特定标准,每片指南有两个通用的标准:

1.它必须可以随时学习或每几个月可以学习。

2.必须是可互动的在线课程,不能仅提供书本或文本教程。

虽然这些都是可行的学习方法,但本指南的重点是课程。严格意义上的视频课程(即没有测验,作业等)也被排除在外。

我们尽力涵盖符合上述标准的所有课程。如果我们错过了一些课程,请给我们留言。

如何评估课程

我们从 Class Central 以及其他评论网站整合了课程的平均评分和评论数量。然后计算每个课程的综合评分。同时根据具体课程评论,并使用此反馈来补充课程评分。

我们根据每个学科的各种特定因素制定了评估大纲。例如,编程导论课程的标准:

1.课程对编程基础的覆盖面。

2.对编程中更先进但实用课题的覆盖面。

3.教学大纲与数据科学的相关度。

以下是每个主题对应的最佳课程。从而构成了一个全面的数据科学课程推荐。

主题#1:编程入门

学习编程:基本原理(LPT1)和制作质量代码(LPT2)

(多伦多大学,Coursera)

多伦多大学的该系列课程为初级数据科学家提供了难度和范围适宜的内容。课程使用 Python ,该系列课程有 284 条评论,综合评分为 4.71 。

通过Python学习交互式编程入门(Part1)(Part2)

(莱斯大学,Coursera)

莱斯大学的Python系列交互式编程包括两个最好的在线课程。课程倾向于游戏和互动应用程序,这在数据科学中不太适用。该系列课程有 6,069 条评论,综合评分为 4.93 。

R 语言编程轨迹

(DataCamp)

如果你正在学习 R 语言,该课程有效地结合了编程基础知识和 R 语言语法指令。该课程有 14 条评论,综合评分为 4.29 。

主题#2:统计与概率

数据分析的基础-Part1:使用 R 语言进行统计和Part2:推理统计

(德克萨斯大学奥斯丁分校,edX)

在 UT Austin 的数据分析系统基础课程中,该课程是少数几个具有高评价,同时教授统计和概率,着力于编程示例的课程。该课程有 28 条评论,综合评分为 4.61 。

统计数据与 R 语言专业化

(杜克大学,Coursera)

该系列分为五个课程,具有全面的教学大纲,全面的介绍概率。该系列课程有 60 条评论,综合评分为 4.77 。

概率导论——科学的不确定性

(麻省理工学院(MIT),edX)

该课程目前在统计学和概率课程推荐中评分最高。该课程比大多数 MOOC 课程更长(15周)同时更具挑战性。该课程有 38 条评论,综合评分为 4.82 。

主题#3:数据科学入门

数据科学A—Z™:包括实际数据科学练习

(Kirill Eremenko,SuperDataScience团队,Udemy )

该课程在教授数据科学的广度和深度方面表现优异。讲师的教学能力出众。该课程有 5,078 条评论,综合评分为 4.5 。

数据分析入门

(Udacity )

该课程使用 Python ,涵盖了的数据科学过程。该课程有 2 条评论,综合评分为 5 。

数据科学基础

(Big Data University)

课程涵盖了完整的数据科学过程,并介绍了 Python,R 语言和其他几个开源工具。分析用的评论网站上没有关于本课程的评论。

主题#4:数据可视化

数据可视化与 Tableau 专业化

(加利福尼亚大学戴维斯分校,Coursera)

该课程深入介绍了可视化理论。通过演练和最终项目提供使用 Tableau 练习的机会。该课程有 2 条评论,综合评分为 4 。

数据可视化与 ggplot2 系列

(DataCamp)

该课程涵盖了大量的理论,并得到 ggplot2 创建者 Hadley 韦翰的支持。课程完成后你会很好掌握关于 R 语言及其句法。分析用的评论网站上没有关于本课程的评论。

Tableau 10 系列(Tableau 10 A-Z和 Tableau 10 进阶训练)

(Kirill Eremenko,SuperDataScience 团队,Udemy)

该系列课程主要侧重于工具覆盖(Tableau),而不是数据可视化理论。这两个课程共有 3,724 条评论,综合评分为 4.6 。

主题#5:机器学习

机器学习

(斯坦福大学,Coursera )

课程讲师为 Google Brain 创始人,百度前首席科学家吴恩达。课程涵盖了机器学习工作流程的所有方面和几种算法。使用 MATLAB 和 Octave,课程有 422 条评论,综合评分为 4.7 。

机器学习

(哥伦比亚大学,edX )

与斯坦福大学相比,该课程是一门更新的课程。本课程的作业可以用 Python、MATLAB 或 Octave完成。该课程有 10 条评论,综合评分为 4.8 。

机器学习A-Z™:使用 Python 和 R 语言进行数据科学实践

(Kirill Eremenko,Hadelin de Ponteves,Udemy)

该课程提供了令人印象深刻的详细教程,并且使用 Python 和 R 语言教学,这在其他顶级课程中是罕见的。该课程有 8,119 条评论,综合评分为 4.5 。

主题#6:深度学习

使用 TensorFlow 学习深度学习的创造性应用

(Kadenze)

Parag Mital 在深度学习方面的创造性应用为技术学科增添了独特的转折性。“创造性应用”是鼓舞人心的,这门课程是专业制作的。课程使用 Python ,该课程有 16 条评论,综合评分为 4.75。

机器学习的神经网络

(多伦多大学,Coursera )

Geoffrey Hinton 称为“深度学习的教父”,他在人工神经网络方面的研究享誉国际。他的机器学习神经网络是一门进阶课程。课程使用 Python ,有 35 条评论,综合评分为 4.11。

深度学习A-Z™:人工神经网络实践

(Kirill Eremenko,Hadelin de Ponteves,Udemy )

该课程介绍了深度学习基础知识,Kirill Eremenko 提供了直观的解释,Hadelin de Ponteves 进行了代码演示。课程使用 Python ,有 1,314 条评论,综合评分为 4.6。

以下是数据科学方面相关的补充主题

Python 及其工具

Python 编程追踪,以及其他 pandas 课程(DataCamp):

• pandas 基础

• 用 pandas 操纵数据帧

• 用 pandas 合并数据帧

DataCamp的重视代码的教学风格和浏览器内置编程环境非常适合学习语法。其Python课程有 14 条评论,综合评分为 4.64。Udacity的数据分析入门课程,也包含 NumPy 和 panda 内容也是数据科学入门课程的推荐之一。

R 语言及其工具

R 语言编程追踪,以及相关 dplyr 和 data.table 课程(DataCamp):

• 使用 R 语言的 dplyr 进行数据处理

• 使用 R 语言的 dplyr 连接数据

• 通过 data.table 方式 用 R 语言进行数据分析

该课程有效地结合了编程基础知识和 R 语言语法。该课程有 14 条评论,综合评分为 4.29。

数据库和SQL

数据库导论

(斯坦福大学, 斯坦福OpenEdx)

该课程全面介绍数据库理论,同时引入了几个开源工具。编程练习很具挑战性。该课程有 59 条评论,综合评分为 4.61。

数据准备

导入和清除数据追踪(DataCamp):

• 使用 Python 轨道导入和清除数据

• 使用 R 语言 轨道导入和清除数据

该系列课程擅长教授为分析和/或可视化准备数据的机制。分析用的评论网站上没有关于本课程的评论。

探索性数据分析

使用 R 语言进行数据分析

(Udacity,Facebook)

该课程对探索性数据分析进行了。对Facebook的数据科学家进行的专家访谈是富有洞察力和鼓舞人心的。同时还可以作为对 R 语言的简单介绍。该课程有 19 条评论,综合评分为 4.58。

大数据

终极实践Hadoop - 驯服你的大数据!以及其他相关工具课程(Frank Kane,Udemy):

• 使用 Apache Spark 和 Python 驯服大数据 - 实践!

• 使用 MapReduce 和 Hadoop 驯服大数据 - 实践!

• Apache Spark 2.0 与 Scala - 大数据交流!

• 使用 Spark Streaming 和 Scala 驯服大数据 - 实践!

Frank Kane的大数据系列课程教授了所有最受欢迎的大数据技术,其中包括超过 25 个“终极”课程。Kane 分享了他在亚马逊和IMDb分享系统工作十年的经验知识。总共这些课程有 6,932 条评论,综合评分为 4.52。

软件技能

软件测试 (Udacity)

软件调试 (Udacity)

版本控制与Git 和 GitHub协作(Udacity) (更新到如何使用Git&GitHub课程)

软件技能是数据科学教育的一个经常被忽视的部分。Udacity的测试、调试和版本控制课程介绍了与代码相关的三个核心主题。总共这些课程有 68 条评论,综合评分为 4.34。佐治亚理工学院和Udacity有一个新的课程,包括软件测试和调试,尽管它更先进,但不完全与数据科学家相关。

其他

建立数据科学团队

(约翰霍普金斯大学 , Coursera)

学会如何学习:强大的心里工具帮助你掌握难题

(Barbara Oakley 博士,加州大学圣地亚哥分校,Coursera)

思维转移:突破学习障碍,发掘潜在潜能

(Barbara Oakley 博士,麦克马斯特大学,Coursera)

约翰霍普金斯大学的课程在建设数据科学团队的实践中提供了有用的探索。这是一门非常短的课程,可以在几个小时内完成,并免费审核。忽略其有 12 条评论,综合评分为 3.41,其中一些可能来自付费客户。

Barbara Oakley 博士的这两门课程本身并不是数据科学课程。“学会如何学习”是最受欢迎的在线课程,包括通过研究的实践从而以最有效地掌握难题,以及记忆技术和处理拖延。在“思维转移”中,她展示了如何充分利用在线学习和MOOC课程,如何寻求并与导师一起工作,以及避免生活中的职业路线和一般路线的秘密。这是每个人都应该参加的两门课程。课程分别有 959 和 407 条评论,综合评分为 4.74 和 4.87。

结语

本文是六部曲系列的最后一篇文章,介绍了进入数据科学领域的最佳在线课程。第一篇文章介绍了编程(想学习数据科学?我们整理了一份优质编程入门课程清单),第二篇介绍了统计和概率(数据科学优质课程推荐#2:统计入门课程篇),第三篇介绍了数据科学入门课程,第四篇介绍了数据可视化,第五篇介绍了机器学习相关课程。

ref:

https://medium.freecodecamp.com/the-best-data-science-courses-on-the-internet-ranked-by-your-reviews-6dc5b910ea40

原文发布于微信公众号 - CDA数据分析师(cdacdacda)

原文发表时间:2017-06-02

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏ATYUN订阅号

【业界】帮化学家偷个懒,利用量子计算来模拟化学反应

AiTechYun 编辑:xiaoshan.xiang 第一个已知的经典“计算机”是Antikythera mechanism,这是一种模拟机器,用于模拟天体在...

30460
来自专栏人工智能快报

谷歌及其他公司正构建能自我怀疑的人工智能系统

谷歌(Google)、优步(Uber)等公司正在构建能自我怀疑的人工智能系统,人工智能将会通过接受不确定性来做出更好的决定。 深度学习作为人工智能中最强大的方法...

370120
来自专栏人工智能头条

你应该知道的机器学习方法

14620
来自专栏杨熹的专栏

简单粗暴地入门机器学习

有很多小伙伴问过我零基础要怎么入门机器学习或者人工智能,今天来提炼一下,方便志同道合的朋友们参考。 记得我刚入此山洞准备修炼的时候,就 Google 了好多这类...

47260
来自专栏PaddlePaddle

深度学习行业中的各类岗位概览

后端(RD)工程师:让算法工程师产出的代码落到业务中,适用于工业调用(比如配置数据库和设定便捷的交互)

11830
来自专栏数据派THU

避坑指南:数据科学家新手常犯的13个错误(附工具、学习资源链接)

本文是老司机给数据科学家新手的一些建议,希望每个致力于成为数据科学家的人少走弯路。

12110
来自专栏CSDN技术头条

你应该知道的机器学习方法

决定何时以及如何在你的团队中使用AI技术是一项艰巨的任务。可选的技术比比皆是:据venturescanner.com网站显示,目前VCs给多达885家AI公司投...

20880
来自专栏AI科技大本营的专栏

一份为高中生准备的机器学习与人工智能入门指南

翻译 | AI科技大本营 参与 | 林椿眄 作为一名高中生,我在过去的一年里自学了机器学习与人工智能的相关课程,在这里和大家分享下我自己的学习心得,希望能够对那...

41360
来自专栏PPV课数据科学社区

AI时代就业指南:普通程序员转行大数据十问十答

随着大数据的爆发,中国IT业内环境也将面临新一轮的洗牌,不仅是企业,更是从业人员转型可遇而不可求的机遇。如果将IT人士统一比作一条船上的海员,大数据就是最大的浪...

44250
来自专栏AI科技大本营的专栏

肖仰华谈知识图谱:知识将比数据更重要,得知识者得天下

比如“C罗”是一个实体,“金球奖”也是一个实体,他们俩之间有一个语义关系就是“获得奖项”。“运动员”、“足球运动员”都是概念,后者是前者的子类(对应于图中的su...

16450

扫码关注云+社区

领取腾讯云代金券