首页
学习
活动
专区
工具
TVP
发布

Datawhale专栏

专栏作者
504
文章
699126
阅读量
75
订阅数
《如何打一场数据挖掘赛事》入门版
这是一份简易的竞赛教程,我们的目的是帮助同学们迈出 AI 训练大师之路的第一步。数据挖掘中会有很多需要学习的地方,建议入门的同学可以暂时不用着急去弄懂各个代码的原理,先跑通代码,然后看代码中的涉及的知识点去查询相关资料进行学习,这样能让你学习更加有目标性,也容易找到学习的乐趣。千里之行,始于足下,从这里,开启你的 AI 学习之旅吧!
Datawhale
2022-10-31
2260
机器学习算法备忘单!
机器学习(ML)是人工智能(AI)和计算机科学的一个子领域,主要是利用数据和算法来模仿人的学习方式,逐步提高其准确性。使用这个树状图作为指南,以确定使用哪种ML算法来解决你的AI问题。
Datawhale
2022-10-31
3530
机器学习必知必会10大算法!
现在,机器学习有很多算法。如此多的算法,可能对于初学者来说,是相当不堪重负的。今天,我们将简要介绍 10 种最流行的机器学习算法,这样你就可以适应这个激动人心的机器学习世界了!
Datawhale
2022-04-08
3880
逻辑回归 + GBDT模型融合实战!
协同过滤和矩阵分解存在的劣势就是仅利用了用户与物品相互行为信息进行推荐, 忽视了用户自身特征, 物品自身特征以及上下文信息等,导致生成的结果往往会比较片面。而这次介绍的这个模型是2014年由Facebook提出的GBDT+LR模型, 该模型利用GBDT自动进行特征筛选和组合, 进而生成新的离散特征向量, 再把该特征向量当做LR模型的输入, 来产生最后的预测结果, 该模型能够综合利用用户、物品和上下文等多种不同的特征, 生成较为全面的推荐结果, 在CTR点击率预估场景下使用较为广泛。
Datawhale
2020-12-18
1.3K0
机器学习集成学习与模型融合!
对比过kaggle比赛上面的top10的模型,除了深度学习以外的模型基本上都是集成学习的产物。集成学习可谓是上分大杀器,今天就跟大家分享在Kaggle或者阿里天池上面大杀四方的数据科学比赛利器---集成学习。
Datawhale
2020-08-20
9100
每日一问 - 关于决策树算法
来源:Datawhale优秀回答者 每日一问(决策树算法) 1. 用自己的理解讲讲决策树算法?(必知必会) 2.决策树如何防止过拟合?(面试真题) 优秀汇总(逻辑回归算法) 1. 逻辑回归和线性回归的
Datawhale
2020-08-17
2930
机器学习之sklearn基础教程!
本次分享是基于scikit-learn工具包的基本分类方法,包括常见的Logisitic Regression、支持向量机、决策树、随机森林以及K近邻方法KNN。本文在基于读者已经基本了解这些基本算法的原理以及推导的基础上,使用sklearn工具包进行算法实践,如果大家没有掌握基本算法原理,文中也会给出一些优秀的链接方便大家学习。如果大家对基本分类算法的基本原理有需求,可以在评论区写下自己的需求,我们会根据大家的意见推出相应的分享。
Datawhale
2020-08-17
6260
【白话机器学习】算法理论+实战之决策树
如果想从事数据挖掘或者机器学习的工作,掌握常用的机器学习算法是非常有必要的, 常见的机器学习算法:
Datawhale
2020-03-04
6040
终于有人把XGBoost 和 LightGBM 讲明白了,项目中最主流的集成算法!
本文是决策树的第三篇,主要介绍基于 Boosting 框架的主流集成算法,包括 XGBoost 和 LightGBM。
Datawhale
2019-11-07
3.2K1
最常用的决策树算法!Random Forest、Adaboost、GBDT 算法
本文主要介绍基于集成学习的决策树,其主要通过不同学习框架生产基学习器,并综合所有基学习器的预测结果来改善单个基学习器的识别率和泛化性。
Datawhale
2019-11-06
1.1K0
最常见核心的决策树算法—ID3、C4.5、CART(非常详细)
决策树是一个非常常见并且优秀的机器学习算法,它易于理解、可解释性强,其可作为分类算法,也可用于回归模型。本文将分三篇介绍决策树,第一篇介绍基本树(包括 ID3、C4.5、CART),第二篇介绍 Random Forest、Adaboost、GBDT,第三篇介绍 Xgboost 和 LightGBM。
Datawhale
2019-11-05
4.1K0
决策树算法十问及经典面试问题
2.ID3和C4.5算法可以处理实数特征吗?如果可以应该怎么处理?如果不可以请给出理由?
Datawhale
2019-11-05
1.1K0
周志华:“深”为什么重要,以及还有什么深的网络
IJCAI 2019 在中国澳门隆重召开,南京大学周志华教授进行特邀大会演讲,演讲主题是《Deep Learning: Why deep and is it only doable for neura
Datawhale
2019-10-30
3520
机器学习与深度学习核心知识点总结
梯度下降法沿着梯度的反方向进行搜索,利用了函数的一阶导数信息。梯度下降法的迭代公式为:
Datawhale
2019-10-23
6310
机器学习必知必会10大算法
预测建模主要关注的是在牺牲可解释性的情况下,尽可能最小化模型误差或做出最准确的预测。我们将借鉴、重用来自许多其它领域的算法(包括统计学)来实现这些目标。
Datawhale
2019-10-23
3760
机器学习常见算法及优缺点!
2、使用基于决策树的combination算法,如bagging算法,randomforest算法,可以解决过拟合的问题。
Datawhale
2019-10-15
9620
谈谈你对集成学习的见解与认识,描述一下它们的优势所在?
集成方法有很多种,一种叫做bagging,bagging的思想是,我把我的数据做一点微小的调整,就得到了一个跟原来不一样的数据集,我就能多训练一个模型出来,模型的数量多了,解释力自然就增强了。比如说我原来有100个人的数据,其中有两个分别叫Tony和Lily,我把Tony这条数据删掉,用Lily的数据来替换,这样就得到了一个跟原来不一样的全新的数据集,这个过程叫做Bootstrap。
Datawhale
2019-07-08
1.2K0
决策树,逻辑回归,PCA-算法面经
决策树是一种自上而下,对样本数据进行树形分类的过程,由节点和有向边组成。节点分为内部节点和叶节点,其中每个内部节点表示一个特征或属性,叶节点表示类别。从顶部节点开始,所有样本聚在一起,经过根节点的划分,样本被分到不同的子节点中,再根据子节点的特征进一步划分,直至所有样本都被归到某个类别。
Datawhale
2019-07-08
5740
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档