首页
学习
活动
专区
工具
TVP
发布

曲奇的博客

专栏作者
33
文章
28717
阅读量
17
订阅数
AB实验中不同类型指标使用的假设检验方法
衡量业务表现有很多的指标,比如均值类指标、比例类指标等。不同的指标类型,服从不同的概率分布,我们需要通过一个合理的检验方法,了解指标本身的离散程度,才能知道当指标发生变化的时候,是不是说明实验是显著的还是自然的波动。所以在进行AB实验的过程中,需要使用不同的假设检验方法。
曲奇
2022-05-30
4.4K0
AB实验的踩坑之路
AB实验是互联网行业产品功能优化和迭代常用的工具,覆盖了大部分的需求场景,如内容推荐、搜索、商业化、UI迭代等。从统计学的角度出发,AB实验本质上是使用假设检验去证明假设是否成立,从而达到验证我们想法的目的。本文记录了在日常使用AB实验中涉及到的一些比较常见的陷阱。
曲奇
2022-05-09
8850
聊一聊因果推断中的ATT、ITE、ATE和CATE
ATT :Average Treatment Effects on Treated
曲奇
2022-05-09
2K0
数据分析中不得不知道的留存知识
互联网流量竞争愈发激烈,获客成本不断提升,企业不可能无限制的投入成本拉取新用户,那么最大限度的保证用户的留存就变得异常重要。最近看了红杉资本一篇关于留存的文章,翻译了大概的要点,也稍微添油加醋。
曲奇
2022-05-09
7730
LTV (Life Time Value) 生命周期价值是怎么计算的
LTV(Life Time Ⅴalue)指的是某个用户在生命周期内为该游戏应用创造的收入总计,可以看成是一个长期累计的ARPU值。用户的生命周期是指一个用户从第一次启动游戏应用,到最后一次启动游戏应用之间的周期。 作用:
曲奇
2022-04-02
2.9K0
因果推断DiD方法在游戏数据分析中的实践
我们在日常数据相关的工作中,常常需要去推断结果Y是否由原因X造成。“相关性并不意味着因果关系”,相信做数据分析的同学都明白这个道理。有一个喜闻乐见的例子:夏天海岸,鲨鱼袭击事件较其他季节多20%,同时冰淇淋销量比其他季节多100%,冰淇淋销量和鲨鱼袭击事件成正相关关系,得出结论销售冰淇凌会导致鲨鱼袭击。这实际上是违背常识的。
曲奇
2022-01-21
1.8K0
数据分析,为什么需要因果推断
“相关性并不意味着因果关系”,相信做数据分析的同学都明白这个道理。有一个喜闻乐见的例子:夏天海岸,鲨鱼袭击事件较其他季节多20%,同时冰淇淋销量比其他季节多100%,冰淇淋销量和鲨鱼袭击事件成正相关关系,得出结论销售冰淇凌会导致鲨鱼袭击。这实际上是违背常识的。好奇心是人类的天性,我们肯定会问:why?
曲奇
2022-01-21
2450
算法岗机器学习相关问题整理(推荐系统部分)
From https://blog.csdn.net/gxq1221/article/details/81113346 腾讯18年数据挖掘
曲奇
2021-12-15
4070
算法岗机器学习相关问题整理(深度学习部分)
w的更新方向由 决定,而 对所有的w_i是常数,所以实际上w的更新方向由 决定。
曲奇
2021-12-15
6090
算法岗机器学习相关问题整理(无监督算法部分)
From https://blog.csdn.net/gxq1221/article/details/81113346 腾讯18年数据挖掘
曲奇
2021-12-15
2570
算法岗机器学习相关问题整理(树类模型部分)
树 决策树相比其他算法有什么优势? 阿里暑期算法来自 https://www.nowcoder.com/discuss/373146?type=2&order=3&pos=7&page=1 决策树易
曲奇
2021-12-15
2930
算法岗机器学习相关问题整理(LR&SVM部分)
今年找工作整理了一份机器学习岗的面经,在3月中旬拿到了某大厂的暑期实习offer,整理一下发出来和小伙伴们一起学习。这个面经分为多个部分,会不断更新。除此之外,还有几本参考书:
曲奇
2021-12-15
3480
机器学习模型的可解释性
通过模型可解释方法,可以直观地传递关于模型行为的解释,比如为什么这个样本被预测为这个标签,某个特征对预测结果起到了什么样的作用。
曲奇
2021-12-14
1.9K0
推荐系统中的自动化特征工程
在机器学习的各个子领域中,特征工程都扮演着重要的角色。业界有这么一句话,数据和特征决定了机器学习算法的上限,而模型、算法的选择和优化只是在不断逼近这个上限。通过运用领域知识,在原始数据集中构造解释变量,有利于机器学习模型预测目标。传统的特征工程方法是运用与问题相关的领域专业知识,从数据集中提取特征。我们称之为手动特征工程,手动特征工程的缺点在于繁琐耗时,对于不同的问题需要重新开始,过于依赖人的经验与判断。因此,研发自动特征工程就尤为重要。
曲奇
2021-12-14
1.1K0
智能运维常见时序数据异常点检测技术
基于数据,构建一个概率分布模型,得出模 型的概率密度函数。通常,异常点的概率是很低的。
曲奇
2021-12-14
1.3K0
算法岗机器学习相关问题整理(大数据部分)
MapReduce是apache公司开发的,基于该框架能够使应用程序能够运行在大规模集群上,并以一种可靠的,具有容错能力的方式并行地处理上TB级别的海量数据集。MapReduce的思想就是“分而治之”,Mapper负责“分”,即把复杂的任务分解为若干个“简单的任务”来处理;Reducer负责对map阶段的结果进行汇总。
曲奇
2021-12-14
4910
matplotlib中文入门文档(user guide)
最近自己经常遇到matplotlib的OO API和pyplot包混乱不分的情况,所以抽时间好好把matplotlib的文档读了一下,下面是大概的翻译和总结。很多基础的东西还是要系统地掌握牢固哇~~
曲奇
2021-12-14
9010
Matplotlib Pyplot教程
最近自己经常遇到matplotlib的OO API和pyplot包混乱不分的情况,所以抽时间好好把matplotlib的文档读了一下,下面是大概的翻译和总结。很多基础的东西还是要系统地掌握牢固哇~~另外一篇翻译是
曲奇
2021-12-14
6920
正则表达式速查
我们已经提到了怎么重复单个字符(直接在字符后面加上限定符就行了);但如果想要重复多个字符又该怎么办?你可以用小括号来指定子表达式(也叫做分组),然后你就可以指定这个子表达式的重复次数了。
曲奇
2021-12-14
4330
【机器学习每日一问10】如何抽取一段视频的特征
以推荐系统为例,视频 embedding 分为基于内容的 embedding 和基于行为的 embedding
曲奇
2021-12-14
3100
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档