专栏首页木东居士的专栏给你一个亿, 年底能做到多少DAU?

给你一个亿, 年底能做到多少DAU?

各位托尼和简妮,大家好,变成狗剩儿和翠花儿是不是也挺温馨的?不管叫什么名字,咱们回家是不是都应该好好学习一下?

今天我们就来聊点看似土里土气的东西:如何使用EXCEL—看到这儿,估计流失了60%的PV了,继续看下去的80%赚了—如何使用EXCEL进行深度数据分析。呃,是不是干货?自己判断吧!

关键字:APP推广、活跃用户(MAU/WAU/DAU)、EXCEL、幂函数/指数函数/对数函数/indirect函数

适用范围:APP推广、预算制定、效果评估

应用场景:

老板:这个App做得不错,明年给你几千万推广一下, 到年底活跃用户能达到多少?

Tony经理: 呃……几百万吧?

老板:几百万是几百万?

Tony经理:具体到多少不好说。

老板:G-U-N~~~~

如果:

---你是这位老板,手下人说算不出来,拿这篇文章去扣他年终奖吧!

---你是这位Tony,得压着下面的人算吧?下面的人也说算不出来?拿着这篇文章去扣他绩效吧!

---你就是这位干活的哥们/姐们,还不赶紧好好研读一下?

闲话少叙,进入正题:

一、影响DAU/MAU的主要因子是什么?

我们先来看一个APP的DAU变化趋势,如下图,可以明显的分成三个阶段:从1月中到2月底,DAU有一个上升的趋势;但是接下来的一段时间,DAU停滞不前了;从四月中下旬开始,又开始上升。

这说明一个什么问题呢?用脚趾头想一下,当新进来的用户大于流失的用户时,活跃用户上升;持平时,DAU基本稳定。问题的关键在于,随着用户的累积,流失的用户越来越多。但是,定量关系如何?具体有多少留存率了多少流失了?着急就对了,这正是我们要解答的问题。

回答这个问题之前,我们来梳理一下一个app的用户从无到有的用户变化过程。

假设某APP, 元旦发版,当天新增了10000用户,这批用户1月2日活跃了6000,自然引出次日留存率的概念,为60%;1月3日活跃了5千,也就是2日后的留存率为50%;…;30日后的留存率为6.5%。如下:

紧接着,1月2日又新增了20000用户,留存情况如下:

以此类推,不赘述。

Attention, 关键的步骤来了。

这个APP 1月1日发布,每天都有新增,每天也有流失(或沉默),到1月8日的时候,活跃用户能达到多少?

1月8日的DAU是多少呢?开始是竖着看的,现在换个角度横着看呗!不用我再费口舌了吧?

装逼一下,写成公式就是这样:

其中,各个指标的含义如下:

到这里,我们的第一个问题就回答清楚了:影响DAU的主要因子,是过去N日每一天的新增用户,以及每一天的用户在第N日的留存率。

提炼一下就是两个大指标:新增用户和留存率。

有人会说,新增用户可以受到很多条件的影响,比如最直接的付费推广。同样,留存率的影响也会受到诸多因素的影响,比如产品本身的改进等。能这么想说明你在思考了。但是,不管采用什么手段,最终的DAU都是通过新增和留存这两个指标产生变化的。

找到了新增和留存这两类指标,如何量化他们与活跃用户的关系呢?

一、如何量化新增、留存和DAU的关系?

我们回到前面老板的问题:假如给你一个亿,到年底APP的DAU能达到多少?

一般而言,市场上买量的价格是相对固定的,比如按照激活付费(具体价格视包的大小、app类型、人群等指标而定,问你们家BD吧)。也就是说,新增和银子是直接的对应关系。因此,要回答老板的问题,给定了预算,你能买回来的新增用户就基本定下来了。

我们接着看公式。为了彰显重要性,我们拉长时间段,再贴一下这个公式:

DAU(12.31)=New(12.31)+New(12.30)*1-DR+New(12.29)*2-DR+New(12.28) *3-DR+……+New(1.1)*364-DR

验算之前,请允许我先说点常识。任何一个模型,它都是有若干前提或假设条件的。这一点能达成共识吧?比如经济学上的理性人假设等。我们这个模型需要用现有的数据去预估未来的数据,最起码的一个假设是:短期内留存率不会发生太大的变动。(有波动也是有办法计算的,有红包就有办法。呵呵。)

有了计算公式,我们来看一下数据源。国内,友盟是使用最广泛的第三方统计平台,就以友盟为例(各平台主要指标大同小异)。(老板别紧张,向习大大保证没有泄密,图片来自百度搜索)。

我们看到,友盟在留存率上只提供9个点的数据。如果以月为维度,可见的是1-9月的留存率;以天为维度的话,那就是1-7日的留存率、14日的留存率、30日的留存率。

根据上面的公式,我们需要知道的是过去N日的新增,以及每一天的新增在第N日的留存率,还记得吧?过去N日的新增,每一天都可以从友盟看到。问题是我们只有9个点的留存数据。

那么,如何根据已有的点去推算剩下那些天的留存率呢?很简单,EXCEL教你1分钟搞定。

第一步:用现有的数据做散点图:

看完这个图,你能想到什么?我们有理由相信:8-13天的留存率是介于第7天和第14天的留存率之间,对吧?(如果不是,要么是量太少了留存率波动太大,要么是通过活动等手段刺激了活跃。这里不讨论。)

可是,具体量化是多少呢?往下看!

第二步:右键添加趋势线,选择拟合度最高的线形

从经验数据看,笔者接触的APP的留存率曲线,符合对数函数和指数函数的居多。

常识告诉我们,数据点越多,拟合的效果越好。如果有条件,可以用自己的服务器跑一跑更长期一点的留存率数据,再用多个数据点拟合曲线。

有了上图中的函数,就可以方便的计算空缺点的留存率数据了。

什么,这都不会?还好意思不给我发个红包?

写到这里,主要的思路和方法就说完了。猫给老虎当师傅的例子涌上心头,我要不要留一手呢?看在过年…和红包, 的份上,就倾囊相授吧。

如果已经看到了这儿,请继续往下,因为接下来是重点。

第三步:Excel如何变成大杀器

直接上结果先:

鉴于保密及各种原因,我只能把初级阶段的成果展示出来,上图大概是此模型的2.3版本吧(5.0版本如果贴出来现老板肯定会炒了我的)。

这个版本实现的功能:在给定未来一段时间新增的情况下(左边数字),按照一定的留存率水平,直接计算出未来这段时期内每一天DAU能够达到的水平(右边折线图)。

In a nutshell, 控制新增用户(通过控制推广费用),就能直接计算出每一天的DAU。

当然,重要的还是计算过程。核心计算过程如下:

如上图:10月15日的实际活跃用户是11万,估算出来的是11.2万,误差为1.81%。

估算的过程:红色框中的数字是根据其后的蓝色框范围中的所有值的和。蓝色框中的每一个值,都是根据前面的留存率公式计算出来的。

具体如下图:

注意上图中右边红色方框:行和列的关系。举例说吧,10月14日新增14528,这14528个用户中10月15日活跃了6577;10月13日新增了13234,这13234个用户15日活跃了4446;以此类推。为什么?记得前面提到的第n日留存率的计算吗?

注意上图中的蓝色框。这个公式是提高效率的关键。把E列每一天的新增数据乘以第n日的留存率之后映射到10月15日所在的这一行。手动根本没法完成,即使你能想到这个完美的解决方案。

好了,干货就介绍完了。再补充一点:

关于留存。这里使用的是平均留存率。如果你的APP受季节性或者其他因素的影响,而每一个次月的留存率变化会比较大,为了更准确你可以每个月的数据都单独算一条曲线再估算缺失点的数据。相对麻烦一些,亲测可行。

作者简介:

梦想超群,曾混饭于咨询公司、游戏公司、互联网公司。性格内向,体格风骚,欢迎关注微信公众号:向内de数据分析湿。已经过作者同意转载此文。

本文分享自微信公众号 - 木东居士(Data_Engineering)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-03-10

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

推荐阅读

  • 远程办公经验为0,如何将日常工作平滑过度到线上?

    我是一名创业者,我的公司(深圳市友浩达科技有限公司)在2018年8月8日开始运营,现在还属于微型公司。这个春节假期,我一直十分关注疫情动向,也非常关心其对公司带来的影响。

    TVP官方团队
    TAPD 敏捷项目管理腾讯乐享企业邮箱企业编程算法
  • 数据中台,概念炒作还是另有奇效? | TVP思享

    作者简介:史凯,花名凯哥,腾讯云最具价值专家TVP,ThoughtWorks数据智能业务总经理。投身于企业数字化转型工作近20年。2000年初,在IBM 研发企业级中间件,接着加入埃森哲,为大型企业提供信息化架构规划,设计,ERP,云平台,数据仓库构建等技术咨询实施服务,随后在EMC负责企业应用转型业务,为企业提供云迁移,应用现代化服务。现在专注于企业智能化转型领域,是数据驱动的数字化转型的行业布道者,数据中台的推广者,精益数据创新体系的创始人,2019年荣获全球Data IQ 100人的数据赋能者称号,创业邦卓越生态聚合赋能官TOP 5。2019年度数字化转型专家奖。打造了行业第一个数据创新的数字化转型卡牌和工作坊。创建了精益数据创新方法论体系构建数据驱动的智能企业,并在多个企业验证成功,正在向国内外推广。

    TVP官方团队
    大数据数据分析企业
  • 扩展 Kubernetes 之 CRI

    使用 cri-containerd 的调用流程更为简洁, 省去了上面的调用流程的 1,2 两步

    王磊-AI基础
    Kubernetes
  • 扩展 Kubernetes 之 Kubectl Plugin

    kubectl 功能非常强大, 常见的命令使用方式可以参考 kubectl --help,或者这篇文章

    王磊-AI基础
    Kubernetes
  • 多种登录方式定量性能测试方案

    最近接到到一个测试任务,某服务提供了两种登录方式:1、账号密码登录;2、手机号+验证码登录。要对这两种登录按照一定的比例进行压测。

    八音弦
    测试服务 WeTest
  • 线程安全类在性能测试中应用

    首先验证接口参数签名是否正确,然后加锁去判断订单信息和状态,处理用户增添VIP时间事务,成功之后释放锁。锁是针对用户和订单的分布式锁,使用方案是用的redis。

    八音弦
    安全编程算法
  • 使用CDN(jsdelivr) 优化博客访问速度

    PS: 此篇文章适用于 使用 Github pages 或者 coding pages 的朋友,其他博客也类似.

    IFONLY@CUIT
    CDNGitGitHub开源
  • 扩展 Kubernetes 之 CNI

    Network Configuration 是 CNI 输入参数中最重要当部分, 可以存储在磁盘上

    王磊-AI基础
    Kubernetes
  • 聚焦【技术应变力】云加社区沙龙online重磅上线!

    云加社区结合特殊时期热点,挑选备受关注的音视频流量暴增、线下业务快速转线上、紧急上线防疫IoT应用等话题,邀请众多业界专家,为大家提供连续十一天的干货分享。从视野、预判、应对等多角度,帮助大家全面提升「技术应变力」!

    腾小云
  • 京东购物小程序购物车性能优化实践

    它是小程序开发工具内置的一个可视化监控工具,能够在 OS 级别上实时记录系统资源的使用情况。

    WecTeam
    渲染JavaScripthttps网络安全缓存

扫码关注云+社区

领取腾讯云代金券