资源 | Kaggle数据科学项目索引表,10大类93项,更新中

大数据文摘出品

作者:蒋宝尚

作为数据科学比赛平台,Kaggle丰富的算法、模型、项目等资源是巨大的宝藏。

为了使Kaggle上的资源获得最大化的利用,一位来自印度的数据科学家sban设计了一个数据科学模型、技术和工具的项目索引表。

在这里你可以查找到你所需要的数据科学资源,并超链接到项目页,附有代码展示。

整个数据科学表,一共提供了十个类别,每个类别里面都有分支,分支里的“词汇”在根据投票数量排列的同时,也在右侧说明了作者,项目实现所使用的编程语言以及阅读数,评论以及获得的投票数量。

另外,这个“索引表”还一直在更新,所以非常具有收藏的价值。

下面文摘菌简单带大家浏览一下这10个类别,想要具体了解的同学请点击:

https://www.kaggle.com/shivamb/data-science-glossary-on-kaggle/

1.回归算法

在本类别中,包括线性回归和逻辑回归两个部分,其中每个部分分别给出了10个示例。

2.正则化算法

此类别下,包含三个分支,分别是Ridge、Lasso、Elasticnet。其中Ridge分支下有10个示例,Lasso分支下有9个,Elasticnet有4个。

3.树形结构模型

此类别下的分支包含Decision Tree、Random Forest、Lightgbm Xgboost Catboost。每个分支下各有10个分支。

4.神经网络和深度学习模型

此类别下包含神经网络、自动编码、深度学习、卷积神经网络、胶囊神经网络等分支,每个分支所下都有所对应的词汇。

5.聚类算法

此类别包含Kmeans、层次聚类 、Dbscan密度聚类等。

6.Misc - Models

此类别包括朴素贝叶斯、支持向量机、临近算法、推荐引擎等的应用和相关示例。

7.重要的数据科学工具

此类别是一个超级类别,其下属包括处理、 维数约减、后建模技术以及模型融合这四个小类别,每个类别下包含若干分支。

8.文本数据

在这一目录下包含了自然语言、主题模型、词嵌入向量。

9.数据科学工具

Scikit、Tensorflow等众多框架和工具都包含在此类别下。

10.数据可视化

Seaborn、D3.Js、Bokeh等著名的数据可视化库和工具都能在此类别下找到。

最后文摘菌再次给出链接,大家请尽情享用吧!

https://www.kaggle.com/shivamb/data-science-glossary-on-kaggle/

今日机器学习概念】

Have a Great Definition

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2018-07-10

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

学界 | 从深度学习研究论文中自动生成可执行源代码

3416
来自专栏CreateAMind

暑期课程第四课:CNN和机器视觉

812
来自专栏PPV课数据科学社区

进阶篇:从 0 到 1 掌握 Python 机器学习(附资源)

进阶篇 ? 机器学习算法 本篇是使用 Python 掌握机器学习的 7 个步骤系列文章的下篇,如果你已经学习了该系列的上篇基础篇:从 0 到 1 掌握 Pyth...

4097
来自专栏机器之心

学界 | 让黑白影像重获新生:UC Berkeley 提出实时神经网络着色模型

选自arXiv 作者:Richard Zhang等 机器之心编译 参与:李泽南 UC Berkeley 的研究人员近日推出了一种利用深度学习对黑白图像进行实时上...

32311
来自专栏大数据智能实战

基于tensorflow实现AI图片鉴黄(NSFW)

       yahoo开源了用于检测图片是否包含不适宜工作场所(NSFW)内容的深度神经网络项目https://github.com/yahoo/open_n...

9449
来自专栏机器学习算法与Python学习

机器学习(6)之朴素贝叶斯NB及实例

关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第二 【Python】:排名第三 【算法】:排名第四 贝叶斯定理是以英国数学家贝叶斯命名...

4817
来自专栏机器之心

ICLR 2018 | 斯坦福大学教授Christopher Manning提出全可微神经网络架构MAC:可用于机器推理

选自arXiv 作者:Drew A. Hudson、Christopher D. Manning 机器之心编译 参与:刘天赐、黄小天 现今,神经网络已在图像识别...

3178
来自专栏新智元

【榜单】GitHub 最受欢迎深度学习应用项目 Top 16(持续更新)

【新智元导读】新智元不久前盘点了2016年 Top50 的深度学习库,本文则根据 GitHub里星标(Star)数多少,整理了排名前16的深度学习应用项目,从风...

5229
来自专栏机器之心

入门 | 极致的优化:智能手机是如何处理大型神经网络的

1706
来自专栏PaddlePaddle

【AI核心技术】课程十四:循环网络模型-课程导引

UAI与PaddlePaddle联合推出的【AI核心技术掌握】系列课程持续更新中!

962

扫码关注云+社区

领取腾讯云代金券