首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Sklearn参数详解—Adaboost

今天这篇讲讲集成学习,集成学习就是将多个弱学习器集合成一个强学习器,你可以理解成现在有好多道判断题(判断对错即01),如果让学霸去做这些题,可能没啥问题,几乎全部都能做对,但是现实情况是学霸不常有,学渣倒是很多,怎么样做才能保证题做对的准确率较高呢?就是让多个学渣一起做, 每个人随机挑选一部分题目来做,最后将所有人的结果进行汇总,然后根据将票多者作为最后的结果;另一种方式就是先让学渣A做一遍,然后再让学渣B做,且让B重点关注A做错的那些题,再让C做,同样重点关注B做错的,依次循环,直到所有的学渣都把题目做了一遍为止。通过上面两种方式就可以做到学渣也能取得和学霸一样的成绩啦。我们把这种若干个学渣组合达到学霸效果的这种方式称为集成学习。

03

抢红包统计学(技术贴,知道为啥自己越抢越穷了吧)

抢红包统计学(技术贴,知道为啥自己越抢越穷了吧) 一、引言 过年前微信群里面流行起来一种“红包接力”的玩法,大概的规则是:群里面先由一人发一个红包,然后大家开始抢,其中“手气最佳”的那个人继续发新一轮的红包,之后不断往复循环。 这时候大家或许就会问了,一直这么玩下去会有什么结果呢?是“闷声赚大钱”了,还是“错过几个亿”了?是最终实现“共同富裕”了,还是变成“寡头垄断”了?要解答这些问题,就得先了解一些统计学的知识,然后模拟一些随机实验,得到的结果或许会让你大跌眼镜呢。 二、红包初级模型:“切面条法” 微信

05

数据产品指标波动归因分析设计思路

日常工作中,数据同学经常会被老板或业务问到“昨日XX指标波动50%,帮忙看下什么原因?”,也有上来直接来一句“今天数据是不是有问题啊?”,数据同学心里一惊,“我X,是不是集群延迟了?/难道昨天修改逻辑,改出Bug了吗”,于是先去找到指标对应的数据任务,排查数据加工流程有无异常,检查了一遍任务运行正常,各个环节数据无误,松了一口气。开始分析波动原因,经过多个维度的拆解分析后,发现南京下降影响最大,结合最新公布的疫情信息,回复老板/业务说,“昨日数据波动的主要原因是XXX,指标总体下降XX,其中南京下降XX,影响率XX”。一轮操作后,一上午过去了,既定的排期任务又要晚上加班搬砖了。

01
领券