最新数据科学和机器学习 MOOC 资源,成为高手的个性化课程组合

【新智元导读】今天我们要介绍的主人公叫 David Venturi。一年前他还没有编程背景,凭着对数学的爱好开始上网自学。后来他被加拿大一所大学的计算机科学专业录取,但仅过了两个礼拜就退学了,因为他发现想学的东西都能在网上找到。于是,Venturi 综合 edX、Coursera、Udacity 等网站,自己设计课程组合,在家完成了数据科学家“硕士学位”。下面就让新智元来带你看看他的私人课表——他能做到,你同样也可以!

温馨提示:这些课程可不是看看视频就能应付了事的,它们都是带有一定的互动性,而且有的课程的总长度都在100个小时以上。有些课程是有开课日期的,有些是能根据自己的进度来安排的,最好提前作了解,以免错过开学的日期。祝学习愉快!

预科模块

如果你在大学没有接触过计算机科学专业,那么下面就是美国大一大二学生的专业课内容,分别是编程入门、计算机科学入门、数学。

【Udacity】Intro to Programming

地址:https://www.udacity.com/course/intro-to-programming-nanodegree--nd000

课程总设计长度4个月,评分4.5颗星。(编者按:有的人可以在2.5个月完成。每个人进度不同。)这门课程会教学生怎样使用 HTML 和 CSS 去编写自己的网站;Python基础语言;后端编程,数据库;一点点 JavaScript,APIs,recursion 和 parallel computing。Udacity 把它的课程分割成很多迷你短课,很多视频还不到5分钟,课后还会有一些习题。大作业,也就是projects,会得到老师的评分。

【Harvard/edX】CS50: Introduction to Computer Science

地址:https://www.edx.org/course/introduction-computer-science-harvardx-cs50x

总设计长度为一个学期,评分4.5颗星。你将会学到算法、抽象、数据结构等知识,会接触C,Python,SQL,JavaScript,CSS 等语言。这门课是完全免费的,但是可以花90美元得到一个结业证书。

【MIT】Mathematics for Computer Science

地址:http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-042j-mathematics-for-computer-science-fall-2010/

总长度为25堂课,无评分。这门课包含了逻辑,证明方法、数集、排列组合、离散概率等一系列数理基本知识。

数据核心模块

以下的课程全部来自 Udacity 的 Data Analyst Nanodegree系列。全部课程+作业总时长是378小时。之所以强烈推荐这一系列是因为,第一,它好评如潮;第二,这些课程有一些是由 Facebook、Google 等公司设计的。这个系列,不论是宽度、深度、连贯度,都能给学生带来很好的教育体验。

【Udacity】Intro to Inferential Statistics

地址:https://www.udacity.com/course/intro-to-inferential-statistics--ud201

【Udacity】Intro to Descriptive Statistics

地址:https://www.udacity.com/course/intro-to-descriptive-statistics--ud827

【Udacity】Intro to Data Analysis (Using NumPy and Pandas)

地址:https://www.udacity.com/course/intro-to-data-analysis--ud170

【Udacity】Data Wrangling

地址:https://www.udacity.com/course/data-wrangling-with-mongodb--ud032

【Udacity】SQL for Data Analysis

地址:https://www.udacity.com/course/sql-for-data-analysis--ud198

【Udacity】MongoDB for Data Analysis

地址:https://www.udacity.com/course/data-wrangling-with-mongodb--ud032

【Udacity】Data Analysis with R

地址:https://www.udacity.com/course/data-analysis-with-r--ud651

【Udacity】Intro to Machine Learning

地址:https://www.udacity.com/course/intro-to-machine-learning--ud120

【Udacity】Data Visualization and D3.js

地址:https://www.udacity.com/course/data-visualization-and-d3js--ud507

【Udacity】A/B Testing

地址:https://www.udacity.com/course/ab-testing--ud257

机器学习模块

【Standford/Coursera】Machine Learning

地址:https://www.class-central.com/mooc/835/coursera-machine-learning

这门课曾被评为最佳50免费在线课程,评价为5星,所以绝对不会让学生失望。课程的内容包括:有监督学习,参数算法,神经网络;无监督学习;还有一些案例学习和现在业内的常用方法。

【Kadenze】Creative Applications of Deep Learning with TensorFlow

地址:https://www.class-central.com/mooc/6679/kadenze-creative-applications-of-deep-learning-with-tensorflow

TensorFlow 是 Google的一个开源框架,也是现在在人工智能领域被应用最广的。学完这门课,你将对现在最前沿的算法有所了解,比如什么是 convolutional networks,什么是generative adverarial networks,什么是 recurrent neural networks,如果你还不知道这些最热的名词是什么意思,就赶紧学吧。

【University of California, Berkeley/edX】Distributed Machine Learning with Apache Spark

地址:https://www.class-central.com/mooc/2965/edx-cs190-1x-scalable-machine-learning

这节课包含了机器学习背后的一些统计和算法模型,也会教你去解决一些交叉学科的问题,比如网络广告和认知神经学。

软件工程模块

数据科学的很大一部分工作其实都是不停地编程,编程能力强的人肯定就会快速测试很多设计方案。

【Udacity】Software Testing

地址:https://www.udacity.com/course/software-testing--cs258

【Udacity】Software Debugging

地址:https://www.udacity.com/course/software-debugging--cs259

【Coursera】Mastering Software Development in R Specialization

地址:https://www.coursera.org/specializations/r

R和Python都是数据科学最重要的编程语言。这一围绕R编程的系列课程由约翰霍普金斯大学提供,共分为4门课程:R编程环境,进阶R编程,建立R packages,数据可视化。

后端开发模块

这一模块包含了很多的内容,网站后端、APP后端、一些Linux的基本内容、还包括了数据库的基本操作,如何你从没接触过这些内容,这个模块能帮你逐渐熟悉起来。

【Udacity】 Intro to Backend

地址:https://www.udacity.com/courses/intro-to-backend--ud171

【Udacity】 Developing Scalable Apps in Python

地址:https://www.udacity.com/courses/developing-scalable-apps-in-python--ud858

【Udacity】 Configuring Linux Web Servers

地址:https://www.udacity.com/courses/configuring-linux-web-servers--ud299

【Udacity】 Linux Command Line Basics

地址:https://www.udacity.com/courses/linux-command-line-basics--ud595

【Standford U】 Introduction to Databases

地址:https://www.class-central.com/mooc/1580/stanford-openedx-db-introduction-to-databases

其他资源

学完上面这些,其实你已经可以硕士毕业了,但是再多学一些也无妨……

【Udacity】Intro to Hadoop and MapReduce

地址:https://www.udacity.com/course/intro-to-hadoop-and-mapreduce--ud617

【Coursera】Using Python to Access Web Data

地址:https://www.class-central.com/mooc/4343/coursera-using-python-to-access-web-data

【Coursera】 Building a Data Science Team

地址:https://www.coursera.org/learn/build-data-science-team

【Udacity】 How to Use Git & GitHub: Version Control for Code

地址:https://www.udacity.com/course/how-to-use-git-and-github--ud775

你是不是已经还是点开其中的某些链接开始摩拳擦掌要学习了呢?这些课程很多都是免费的,而且可以自己控制节奏,再不学习,就真的老了!

编译来源:http://davidventuri.com/data-science-masters

原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2017-01-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏2018

刚刚购买的云服务-MySQL

不错支持贴屏!!!还要求不能少于140个字符?这?已经测试过金山云了。看看这次的腾讯云如何?

2195
来自专栏Vamei实验室

程序员电邮札记

“Across the Great Wall, we can reach every corner in the world”。 这是1987年从中科院计算机所...

1847
来自专栏用户3246163的专栏

3.3 期权产品

call option:可以用X价格购买资产的权利 put option:可以用X价格买出资产的权利

6852
来自专栏嵌入式程序猿

看图学BLDC电机

最近项目用到了直流无刷电机的控制,其实在公众号之前的文章给大家多多少少介绍过一些BLDC电机的相关知识,无刷直流电机(BLDC)也被称为电子换向电机。转子上没有...

40912
来自专栏腾讯数据中心

数据中心专用术语词典首发!破译圈内暗语

随着互联网数据中心的蓬勃发展,IDC相关的讯息也呈几何级喷发。不胜枚举的行业术语、不拘一格的表达方式,对传递数据中心相关信息的影响已不可小觑。本文可以帮助大家更...

8114
来自专栏腾讯数据中心

一次泵VS二次泵系统,究竟孰优孰劣?

数据中心空调系统的主要能耗点在于冷水机组和配套的水泵系统的运行,其中,水泵的耗电量约占总空调系统耗电量的20-30%,故节约低负载时水系统的输送能量,意义重大。...

4635
来自专栏阮一峰的网络日志

元数据(MetaData)

元数据是用来描述数据的数据(Data that describes other data)。单单这样说,不太好理解,我来举个例子。 下面是契诃夫的小说《套中人》...

33510
来自专栏阮一峰的网络日志

公众分类法(Folksonomy)

先从一个具体的问题开始思考:如何给电子书分类?(这个问题可以推广到如何给信息分类。) 传统的方法是使用自上而下的目录分类法(Taxonomy)。在中国是中图分类...

43210
来自专栏IT大咖说

一年一度的每周5晚程序员段子又来了

程序员设计的版本号,一般会从1.0开始,然后,1.1、1.2、1.3……1.9,接下来的版本号会是1.10、1.11、1.12……于是有一天,在你的面前放着1....

822
来自专栏Zchannel

Z科技资讯

922

扫码关注云+社区

领取腾讯云代金券