过去的一年里 Kaggle 取得了巨大的发展,除了加入 Google,Kaggle 还从一个主要关注机器学习的竞赛社区,扩展成为一个更广泛的数据科学和机器学习平台。Kaggle 的 CEO Anthony Goldbloom 在其官网上发布了一篇年度官方盘点博客,详细说明了 Kaggle 过去一年取得的成就以及未来的规划,AI 研习社做了编译整理:Kaggle 官方年度盘点:2018,将迎来四点新突破。
除了发布年度盘点文章,近期,Kaggle 上线了一套免费课程,帮助开发者了解数据科学知识,开启新的职业生涯,同时为新的 Kaggle 挑战赛做准备。
在这套课程里,你需要花大量的时间来编程实践,而不仅仅是理论学习。Kaggle 拥有世界上最大的数据科学社区,并且这套课程偏向实战,能够帮助开发者快速掌握数据科学和机器学习。
Kaggle 官方课程主要包括了机器学习,R 语言、数据可视化、深度学习四门课程。
机器学习
机器学习是数据科学里最火的领域,学习这门课能让你快速上手机器学习技术。
网址:https://www.kaggle.com/learn/machine-learning
R 语言
学习 R 语言可以让你快速处理数据分析任务。这门课程包括了数据设置、机器学习和数据可视化。
网址:https://www.kaggle.com/learn/machine-learning
数据可视化
数据可视化是数据科学里用途最多的技能之一,漂亮清晰的图表能够反映出数据集里的变化。
网址:https://www.kaggle.com/learn/data-visualisation
深度学习
通过学习 TensorFlow 来让你的机器学习技能更上一层楼。
网址:https://www.kaggle.com/learn/deep-learning
Dan Becker,数据科学家
Dan 为「财富」前 100 中的 6 家公司做数据科学顾问,他是深度学习库 Keras 的贡献者,拥有计量经济学博士学位。
Rachael Tatman,讲师
Rachael 是活跃的 R 语言用户,并教授 R 语言数年。她已经为 Software Carpenty 和 She Codes 开授讲习班。Rachael 为语言学博士。
Aleksey Bilogur,讲师
Aleksey 是公民数据专家,并且是开源 Python 的贡献者。他为纽约市长办公室和纽约大学 CUSP 工作,拥有数学博士学位。
你们会用什么编程语言来教学?为什么?
基本上是 Python,R 语言章节用的语言是 R。至于哪一种编程语言是适合你的?网上有很多相关的讨论,不过你要明白的是,你的合作伙伴和你用的是同一种编程语言才是最重要的。Python 是目前数据科学领域最流行的编程语言,R 语言则位于第二位,所以我们推荐这两种,不过更偏好 Python。
我要对 Python 语言了解到什么程度,才能学习那些基于 Python 的课程?
你应该熟悉变量、列表、字典、函数和循环,如果你想了解 Python 的入门知识,我强烈推荐 Codecademy 上的 Learn Python sequence(https://www.codecademy.com/learn/learn-python)课程。用户通过学习他们教学大纲的 1-8 节,可以为 Kaggle 机器学习竞赛做准备。他们有付费内容,列在了「pro」表单里,不过你不需要这些材料也能学习 Kaggle 相关的内容。
关于 Kaggle 官方教程的详细信息,可查阅链接:
https://www.kaggle.com/learn/overview