今天向大家介绍一下Kaggle,感觉上面实在是太好玩了。。。所以一定要安利,安利,安利(重要的事情说三遍)
Kaggle是一个数据建模和数据分析竞赛平台。企业和研究者可在其上发布数据,统计学者和数据挖掘专家可在其上进行竞赛以产生最好的模型。这一众包模式依赖于这一事实,即有众多策略可以用于解决几乎所有预测建模的问题,而研究者不可能在一开始就了解什么方法对于特定问题是最为有效的。Kaggle的目标则是试图通过众包的形式来解决这一难题,进而使数据科学成为一场运动。2017年3月8日谷歌官方博客宣布收购Kaggle。
Kaggle 的官网网站:https://www.kaggle.com
Slogan: Making Data Science a Sport
Kaggle中组织一场竞赛的过程如下。
除了公开竞赛以外,Kaggle还向活跃参与者提供私下的比赛,以及为大学团体提供Kaggle-in-Class项目。
根据Kaggle官方提供的数据,Kaggle在全球范围内拥有将近20万名数据科学家,专业领域从计算机科学到统计学、经济学和数学。Kaggle也曾经和NASA、维基百科、德勤和好事达合作举办竞赛。其中的一项奖项高达300万美金的竞赛是Heritage Health Prize,目的是通过病人看病及吃药住院等数据预测明年病人住院的天数。另一项与微软合作的竞赛则旨在提高Kinect的手势识别精度。
Kaggle的竞赛在艾滋病研究、棋牌评级和交通预测方面取得了成果。基于这些成果产生了一系列的学术论文。产生这一结果的原因是实时积分榜促使参加者不断改进以试图超越当前的最佳实践。获胜的方法常常在Kaggle的博客No Free Hunch上展示。
目前的话,我正在看这位大神DanB | Kaggle的文章,感觉写的很通俗易懂。是不是看着很可爱,哈哈哈 (https://www.kaggle.com/dansbecker/kernels)
有兴趣的也可以参考知乎@a2Mia姐的回答
1. Titanic(泰坦尼克之灾) 中文教程: 逻辑回归应用之Kaggle泰坦尼克之灾 英文教程:An Interactive Data Science Tutorial
2. House Prices: Advanced Regression Techniques(房价预测) 中文教程:Kaggle竞赛 — 2017年房价预测 英文教程:How to get to TOP 25% with Simple Model using sklearn
3. Digital Recognition(数字识别) 中文教程:大数据竞赛平台—Kaggle 入门 英文教程:Interactive Intro to Dimensionality Reduction
我保证你不会后悔的。
本文分享自 小草学Python和SQL 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!