Kaggle最受欢迎的10个竞赛数据集

这周两篇文章:

1 机器学习是万能的吗?AI落地有哪些先决条件?如果你刚接触ML,或者对ML觉得很神秘,请先看下这篇文章。 2 如何做才能真正提升计算速度?硬件再牛,也难以招架业务场景中产生的数据,提高算法性能和计算速度是永远的话题。

最近有人问有没有相关数据集,这几天抽时间整理了以下数据集,标题即是Kaggle竞赛题目,可以直接搜索获得赛题详细介绍,在此列出10个参赛队伍最多的竞赛题及标签,最重要的是提供数据集的下载。

Kaggle是提升理解ML的较好平台,学的再多,都不如现在开始动手实践,简历上写的会再多算法,都不如有1个竞赛TOP3有说服力。

1 Titanic: Machine Learning from Disaster

Start here! Predict survival on the Titanic and get familiar with ML basics

2 House Prices-Advanced Regression Techniques

Predict sales prices practice feature engineering, RFs, and gradient boosting

3 Digit Recognizer

CV starts here! Learn computer vision fundamentals with the famous MNIST data

4 TalkingData AdTracking Fraud Detection Challenge

fraudulent click starts here! Can you detect fraudulent click traffic for mobile app ads?

5 Toxic Comment Classification Challenge

NLP starts here! Identify and classify toxic online comments

6 Santander Customer Satisfaction

HOT Which customers are happy customers?

7 2018 Data Science Bowl

CV Find the nuclei in divergent images to advance medical discovery

8 Bike Sharing Demand

Forecasting Forecast use of a city bikeshare system

9 Instacart Market Basket Analysis

选品分析 Which products will an Instacart consumer purchase again?

10 San Francisco Crime Classification

多分类预测 Predict the category of crimes that occurred in the city by the bay

原文发布于微信公众号 - Python与机器学习算法频道(alg-channel)

原文发表时间:2018-08-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

使用Python中对情态动词进行NLP分析

情态动词是一种表示关于动作语义信息的助动词,即可能性(will,should),许可(could,may),义务(shall/must)。一个值得探究的有趣想法...

23230
来自专栏量子位

早发arXiv可多获得65%的引用,但……

对研究人员来说,这么做主要有两个好处。一方面尽早占坑,另一方面可以绕过漫长的同行评议时间,加速圈内人交流工作进展。

10440
来自专栏用户3246163的专栏

3.2 利率相关产品

CF(receive FRA) value = L * (FRA-R)*(T2-T1)

59230
来自专栏数据科学与人工智能

【数据科学】数据科学家教你用数据模型来恋爱。

男生和女生分别是来自不同星球的科学事实已经众所周知的了.男生们总是认为,女生们都是迷一样的生物,他们的情感状态浮动似乎是以秒单位在变化的,难以理解,更勿论预测了...

21570
来自专栏大数据文摘

用神经网络续写《权力的游戏》,这个脑洞有点大(附完整小说下载)

22940
来自专栏大数据文摘

数学之美:两点之间最快的路径

19190
来自专栏北京马哥教育

实战 | 用 Python 选股票,据说可以多挣个20%

本文将使用Python来可视化股票数据,比如绘制K线图,并且探究各项指标的含义和关系,最后使用移动平均线方法初探投资策略。 数据导入 这里将股票数据存储在sto...

64860
来自专栏AI科技大本营的专栏

AI 技术讲座精选:数学不好,也可以学习人工智能(七)——自然语言处理的奇妙神奇之处

机器都能做到吗? 我现在是任由自动化左右吗? 未来AI会让作家失业吗? 请阅读本文。 编译 | AI100 在本系列的第五部分中发现了卷积神经网络...

36190
来自专栏PPV课数据科学社区

【经典】数据科学家教你用数据模型来恋爱

男生和女生分别是来自不同星球的科学事实已经众所周知的了.男生们总是认为,女生们都是迷一样的生物,他们的情感状态浮动似乎是以秒单位在变化的,难以理解,更勿论预测了...

26040
来自专栏AI科技评论

学界 | 用充满爱与和平的GUNs挑战GANs?我可能看了篇假论文

上个世界七八十年代,邓小平爷爷曾郑重其事地提出:和平与发展是当代世界的两大主题。如今,这一伟大宏愿实现的如何? 据联合国今年1月份发布的公报显示:去年一年仅在伊...

410100

扫码关注云+社区

领取腾讯云代金券