收藏丨学习数据科学不可错过的优质资源

作者 The Rickest Ricky

编译 Mika 本文为 CDA 数据分析师原创作品,转载需授权

观看更多国外公开课,点击"阅读原文"

大约两个月前,我开始学习数据科学。我并没有统计学、数学、数据科学、工程学、经济学方面的学位。说实话,在学生时代,数学和统计并不是我的强项,我更擅长语言方面。

我拥有管理学的学士和硕士学位。我论文更偏向于文献综述,而不是运用定量研究方法。我的工作是时尚领域的买手。因此我的教育背景和工作中都很少与数学以及统计打交道。

那我是怎么开始学习数据科学的呢?我对“从数据中获得分析见解”这个观点非常感兴趣。因此,我下定决心去克服对数学和统计的恐惧感。

数据产生的速度非常快,我们可以在2天内生产出2003年以前的所有数据。如今可能更快只需要10分钟。并且这些数据中只有1%进行了分析,该领域充满了可能性。因此我认为我有必要投生数据分析领域,这就是我的初衷。

以下我将从线上课程、Youtube频道、TED演讲、博客、博客等方面列出数据分析领域不可错过的优质资源。

1. 线上课程 MOOC

Coursera创始人吴恩达和Daphne Koller

统计基础(Basic Statistics)

https://www.coursera.org/learn/basic-statistics

掌握统计学对于理解社会和行为科学的研究至关重要。在该课程中,你将学习统计学的基础知识。

机器学习(Machine Learning)

https://www.coursera.org/learn/machine-learning

吴恩达热门的机器学习课程,学习时需要提前掌握一定的编程、数学、统计方面的基础知识。

Python for Everybody

https://www.coursera.org/specializations/python

我强烈推荐这门。如果你像我一样,之前没有相关技术背景,那么通过这堂课能够很好的学习如何用Python进行编程。

2. Youtube频道

Youtube上有很多不错的频道,下面按类别区分。分为教程、会议演讲、训练营三个类型。

教程类型

机器学习

Siraj Raval

https://www.youtube.com/channel/UCWN3xxRkmTPmbKwht9FuE5A

人们对其意见不一,但我仍认为对于初学者而言这个频道是不错的开端。

Harrison Kinsley

https://www.youtube.com/user/sentdex

总体来说,对初学者而言这是不错的开端。这类YouTube教程主要偏向于如何解决某个问题。

Welch Labs

https://www.youtube.com/user/Taylorns34

当中不错的系列教程有:

Learning to see

https://www.youtube.com/watch?v=i8D90DkCLhI&list=PLiaHhY2iBX9ihLasvE8BKnS2Xg8AhY6iV

Neural Networks Demystified

https://www.youtube.com/watch?v=bxe2T-V8XRs&list=PLiaHhY2iBX9hdHaRr6b7XevZtgZRa1PoU

这两个课程主要针对初学者的,有助于掌握概念,绝对值得一看。

统计

Brandon Foltz’s Statistics 101

https://www.youtube.com/channel/UCFrjdcImgcQVyFbK04MBEhA

可汗学院的统计学系列(Khan Academy’s Statistics playlist)

https://www.youtube.com/watch?v=uhxtUt_-GyM&list=PL1328115D3D8A2566

数学

mathbff

https://www.youtube.com/channel/UCy5ev9EE-u5Iwbt2NHrcayw

当你遇到不熟悉的数学术语以及数学规则时,该频道是不错的选择。

Python

Chuck Severance’s Python for Everybody

https://www.youtube.com/user/csev

会议演讲类型

该类型中有些对于初学者来说可能不容易理解,但是可以从中把握数据科学的前沿动态。

PyData

https://www.youtube.com/user/PyDataTV

Open Data Science

https://www.youtube.com/channel/UCDS20hpBFiv_Kdp5Ibh0vew

Data Science Festival

https://www.youtube.com/channel/UCB02fDSj9GR4rhb1APMNclw/feed

Scipy: Scientific Computing with Python

https://www.youtube.com/user/EnthoughtMedia/playlists

O’Reilly

https://www.youtube.com/user/OreillyMedia

Goto

https://www.youtube.com/user/GotoConferences

Google Developers

https://www.youtube.com/channel/UC_x5XG1OV2P6uZZ5FSM9Ttw

KDD 2016

https://www.youtube.com/channel/UCPsUUDUlcTJuP-fRa7z85aQ

KDD 2017

https://www.youtube.com/channel/UC_sfvZvvPUbOQhDs_cqlx_A

训练营类型

General Assembly

https://www.youtube.com/user/gnrlassembly

Data Science Dojo

https://www.youtube.com/user/DataScienceDojo

3. TED演讲

我特别喜欢TED演讲。通过各种话题的演讲者,我总能发现新的事物,获得灵感。

值得注意的是TED演讲分为: TED Talks 和 Tedx Talks。

TED Talks 和 Tedx Talks的区别在于,前者偏向于从全球的角度把握,而后者主要是由当地社区举办。

TED Talks

https://www.youtube.com/user/TEDtalksDirector

TEDx Talks

https://www.youtube.com/user/TEDxTalks

下面列出一些热门的数据科学TED演讲:

我们都是数据科学家

(We’re All Data Scientists | Rebecca Nugent)

https://youtu.be/YMnqPTLoj7o

数据科学家最重要的技能

(The most important skills of data scientists | Jose Miguel Cansado)

https://www.youtube.com/watch?v=qrhRfPY4F4w&feature=youtu.be

给我看数据—成为你自己的专家

(Show me the data — becoming an expert in yourself | Talithia Williams )

https://www.youtube.com/watch?v=TDCYJ3_gx2w&feature=youtu.be

通过讲故事,让数据更有意义

(Making data mean more through storytelling | Ben Wellington)

https://www.youtube.com/watch?v=6xsvGYIxJok&feature=youtu.be

数据的权重

(The Weight of Data | Jer Thorp)

https://www.youtube.com/watch?v=Q9wcvFkWpsM&feature=youtu.be

播客

当然,短短几十分钟的播客不会让你成为专家,但你会听到专业的数据科学家如何谈论相关主题,并将其应用于实际问题。

Data Skeptic

https://dataskeptic.com/

主持人Kyle Polich和Linh Da用通俗易懂的语言解释各种数据科学概念,当中不会涉及到数学或计算。

Partially Derivative

http://partiallyderivative.com/

很遗憾,该播客在2017年9月5日最后一期之后就停播了。通过该播客,我学习到了如何在特定情况下应用相应的机器学习算法。

Partially Derivative的主持人:左起Jonathon Morgan、Vidya Spandana、Chris Albon

Linear Digressions

http://lineardigressions.com/

主持人是数据科学家Katie Malone和UI工程师Ben Jaffe。他们从不同的角度对数据科学进行了阐述。

Learning Machines 101

http://www.learningmachines101.com/

关注机器学习的播客。建议你从头开始听,因为可以让你了解该领域的发展历程,积累必要的理论知识。

Stats + Stories

http://www.npr.org/podcasts/530134710/stats-stories

该播客主要关注统计和新闻方面。由于许多数据科学概念来自统计学,学习如何像统计学家一样思考是非常有用的。

More or Less

http://www.bbc.co.uk/programmes/p02nrss1/episodes/downloads

BBC的播客,主要关注人们身边的数学和统计学问题。

博客

数据科学方面有许多优质的博客,这是可以利用RSS来订阅相关内容。

出版商博客

Data Blog——The Guardian

https://www.theguardian.com/data

英国卫报的博客,分享新闻背后的数据。

Data——O’Reilly Media

https://www.oreilly.com/topics/data

分享关于数据领域的高质量文章

组织机构博客

Facebook Research Blog

https://research.fb.com/category/data-science/

关于数据科学的博客,当中包括各种主题的研究论文; 自然语言处理,计算机视觉等。

AWS AI Blog

https://aws.amazon.com/blogs/ai/

Tableau Blog

https://www.tableau.com/about/blog

Bloomberg——Graphics

https://www.bloomberg.com/graphics

具有数据可视化的经济新闻报道。

Data at GDS Blog

https://gdsdata.blog.gov.uk/

英国政府的数字服务数据博客,从中能够政府对数据的使用情况。

数据社区/门户

FiveThirtyEight

http://fivethirtyeight.com/

美国著名统计学家Nate Silver的网站,主要关注政治和体育方面,有时会在Github中分享数据集。

Fiverthirtyeight风格的图形非常有名。

Analytics Vidhya

https://www.analyticsvidhya.com/

专注数据科学的商业分析方面,包括相关教程、技巧等。

Dataconomy

http://dataconomy.com/

侧重于数据科学在现实中的应用。

KDnuggets

http://www.kdnuggets.com/

著名的数据网站,包括各种主题、新闻、教程等。

Dataquest Blog

https://www.dataquest.io/blog/

包括在线数据科学课程,教程类型文章很有帮助。

个人博客

Jer Thorp: blprnt.blg

http://blog.blprnt.com/

数据可视化方面的专家。

西欧的酒店地图,显示巴黎、伦敦、马德里和罗马等首都城市的酒店密度。

(图片来自Jer Thorp: flickr.com/photos/blprnt/)

Data Science 101

http://101.datascience.community/

Demystifying Data Science的主讲人之一,Ryan Swanstrom。关于如何学习数据科学的不错资源。

Dr. Randal S. Olson

http://www.randalolson.com/blog/

分享如何将数据科学应用于现实生活中的问题。

个人兴趣(时尚和零售方面的数据科学)

Net-A-Porter Technical Blog

http://techblog.net-a-porter.com/

Lyst’s Engineering Blog

https://making.lyst.com/

Etsy Technicla Blog: Code as Craft

https://codeascraft.com/

Stitch Fix Technical Blog

http://multithreaded.stitchfix.com/blog/

原文链接:

https://towardsdatascience.com/learning-data-science-part-1-mooc-youtube-ted-20617dbb7f4b

https://towardsdatascience.com/learning-data-science-part-2-podcasts-blogs-8bed327eb1b5

原文发布于微信公众号 - CDA数据分析师(cdacdacda)

原文发表时间:2018-05-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏专知

这是一篇论文评审吗?

【导读】面对如今每年数量暴增的AI领域顶级会议论文投稿量,作者Zachary C. Lipton在Approximately correct上发表了对论文评审的...

1292
来自专栏CDA数据分析师

Python股市数据分析教程(一):学会它,或可以实现半“智能”炒股

本篇文章是”Python股市数据分析”两部曲中的第一部分,内容基于我在犹他州立大学MATH 3900 (Data Mining)课程上的一次讲座。在这些文章中,...

7307
来自专栏大数据文摘

什么时候应该听取机器决定?

1565
来自专栏DT数据侠

当空间数据遇上机器学习,城市的颜值有了新的度量方法

每个人都生活在一定的空间,城市的各项公共服务设施也需要占据一定的空间。通过对这些空间数据的挖掘和分析,我们能够比以往更科学、更清晰地观察我们所在的城市。9月27...

880
来自专栏镁客网

研究表明:狗的神经元数是猫的两倍,狗或比猫聪明 | 黑科技

1580
来自专栏量子位

最强数据集集合:50个最佳机器学习公共数据集丨资源

外国自媒体mlmemoirs根据github、福布斯、CMU官网等信息,整理了一张50个最佳机器学习公共数据集的榜单,量子位为大家分享一下~

6306
来自专栏AI科技评论

干货 | 数学通大道,算法合自然?

算法对我们的生活中的有着各种潜移默化的影响,但算法是否存在被滥用的情况?本文对算法使用问题提出了自己的看法。

892
来自专栏机器学习算法与Python学习

走近Hinton:AI教父传奇人生

三十多年以来,Geoffrey Hinton一直都处于人工智能研究的边缘地带。他像一个局外人一样坚守着一个简单的观点:计算机可以像人类一样,依靠直觉而不是规则进...

973
来自专栏北京马哥教育

Python股市数据分析教程——学会它,或可以实现半“智能”炒股 (Part 1)

摘要:本篇文章是"Python股市数据分析"两部曲中的第一部分,主要介绍金融数据分析的背景以及移动均线等方面的内容。 本篇文章是"Python股市数据分析"两部...

41310
来自专栏人工智能头条

【CSDN AI 周刊】第11期 | 周志华提出深度森林 引发持续热议

1613

扫码关注云+社区

领取腾讯云代金券