首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >机器学习 | 随机森林推测泰坦尼克号存活概率

机器学习 | 随机森林推测泰坦尼克号存活概率

作者头像
week
发布2021-11-29 14:51:38
发布2021-11-29 14:51:38
4650
举报
文章被收录于专栏:用户画像用户画像

集成学习方法

通过某种方式将多个单一模型组合起来,使用它们的“集体智慧”来解决问题。

随机森林

随机森林由n个决策树组成,模型的预测结果等于各决策树结果的某种“加权平均”

1、对于分类问题,最终结果等于在决策树预测结果中出现次数最多的类别。直观上,可以将每个决策树想象成一个人,而随机森林想象成一场投票,通过少数服从多数的原则取的最终的结果。

2、对于回归问题,最终结果等于决策树预测结果的平均值。

随机森林的建模依据是:一棵树犯错的概率比较大,但是很多树同时犯错的概率就很小了。

建立多个树的过程 现在有N个样本, M个特征 建立多个树,其实就是随机的建立单个树 单个树建立过程:

随机在N个样本当中选择一个样本,重复N次 样本可能会重复。为了让样本数相等 随机在M个特征中选出m个特征 之后建立10棵决策树,每个决策树的样本,特征大多不一样。每个树都是随机有放回的抽样(bootstrop)

随机森林的API

参考链接:https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html?highlight=randomforestclassifier#sklearn.ensemble.Rando

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2021/07/03 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 集成学习方法
  • 随机森林
  • 随机森林的API
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档