前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >「经验」我对用户增长的理解『流失预警篇』

「经验」我对用户增长的理解『流失预警篇』

作者头像
小火龙说数据
发布2022-06-30 16:47:26
7120
发布2022-06-30 16:47:26
举报
文章被收录于专栏:小火龙说数据小火龙说数据

预计阅读时间:10min

阅读建议:本篇为实战经验,会让你有所收获,整体篇幅较长,建议先收藏再阅读。

解决痛点:针对一款产品,如何预警用户是否可能会流失?以及可以采用哪些手段加以干预?

00

序言

用户生命周期,可以划分为六个阶段:潜客期、新用户期、成长期、成熟期、衰退期、流失期,在之前的文章中,小火龙和大家分享了「潜客期」以及「新用户期」数据分析涉及的内容,感兴趣的同学可以戳蓝字部分。

本篇会和大家分享,当用户出现流失迹象时,如何预警并加以干预,小火龙在之前的工作中,花了不少时间在这个项目的研究上,分享一些经验给大家。

01

项目背景

在开始正文之前,先和大家分享一组数据:

根据美国贝恩公司的调查,在商业社会中5%的客户留存率增长意味着公司利润30%的增长,而把产品卖给老客户的概率是新客户的3倍。

当前,互联网公司已经过了用户增长最佳的红利期,增长成本在逐步提升,从目前下跌的股票,也可窥探一二。因此对于产品,服务好存量用户,避免流失,收益将远高于开发同等量级的新用户。由此可见,对于流失用户的召回,将成为决定产品胜败的关键。

不知是否有同学会问:“是否可以不做预警,等到用户真正流失之后再做召回?

答案:可以的,但是召回效果不理想,且成本较高。原因有以下两点:

其一:当用户对产品产生不满而离开,此时通过短信、Push等手段对用户进行召回,用户是非常抵触的。

其二:用户在离开的时候,很可能已经将APP卸载,部分召回手段是无法触达到用户的。

由此可见,当用户已经离开了产品,再想通过各种手段挽回,难度是非常大的。所以,要在用户即将流失前,根据用户的行为特征及属性特征,有效的识别出用户的流失风险,配合多元化召回策略,最大化的留住这批用户。

下面,小火龙将和大家分享一套相对通用的流失预警流程。

02

流失预警框架

流失预警流程可以划分为四个步骤,分别为流失预警、策略召回、AB实验、评估沉淀,形成一个闭环体系。

步骤一:流失预警。流失预警是所有步骤的起始,根据用户的行为特征及属性特征,预测用户在未来一段时间内是否流失以及流失可能性的大小,树模型以及Wide&Deep模型均是比较常用的,将所得到的用户标识、label、置信度输出给下游业务方。

步骤二:召回策略。业务方根据预测的数据,合理匹配「用户」、「触达方式」、「触达内容」,不同产品、不同业务场景的匹配方案均不相同,而探索最优匹配方案,往往是根据尝试获取的。原则只有一个:以最小的成本召回最多的用户。具体干预体系,会在后面和大家分享,先附上小火龙绘制的简易思路图。

步骤三:AB实验。在进行策略召回时,效果是业务方最关心的问题。而AB实验是最直接的评估方式,将一部分随机用户作为基线桶不采取任何策略,另一部分随机用户通过策略进行召回,为了保证用户群体的一致性,可配合DID(双重拆分法),将「用户差异」、「时间差异」、「策略因素」有效剥离,从而得到策略的效果。该步的目的,是度量不同策略的优劣,连同步骤二的召回形成闭环,持续优化「用户」、「触达方式」、「触达内容」的匹配。

步骤四:评估沉淀。对以上每个环节的内容进行优化,沉淀总结经验,在有条件的情况下,落盘至平台,提升后续预警召回的准确率及效率。

以上就是用户流失预警的核心流程,虽然不同产品可能会有一些细节上的差异,但万变不离其宗。分享一个小火龙总结的全景图:

下面会针对预警模型环节进行展开,谈谈注意事项,以及需要避开的一些坑。

03

数据探索环节

在模型搭建前,还需要明确两个问题,是决定模型结果是否可用的关键:

问题一:如何定义用户流失?

如何定义用户流失,这个问题是至关重要的,不同的定义方式会直接影响预测的真实性及准确性。在定义前,需要充分了解业务,与业务方进行讨论,因为不同产品对于流失用户的衡量方式是不同的,不存在通用的定义。这里需要明确两点,「流失行为定义」以及「流失时间窗口定义」。

流失行为定义

不同产品、不同场景,流失的行为定义均是不同的,关键在于做预警的目的是为了什么。

举个例子

不同产品

  • 对于电商型产品而言,购买可作为关键行为,用户多久没有下单,认为此用户已经流失;
  • 对于内容型产品而言,登录可作为关键行为,用户多久没有登录,认为此用户已经流失。

不同场景

  • 对于电商型产品,聚焦母婴品类用户是否流失,则关注母婴品类多久没有下单,认为此用户已经流失;
  • 对于电商型产品,聚焦汽车品类用户是否流失,则关注汽车品类多久没有下单,认为此用户已经流失。

流失时间窗口定义

用户流失预警的时间窗口主要包含:「特征选择期」、「空档期」、「预测期」,通俗来讲就是根据「用户过去多久的行为」来预测「用户未来多久流失的概率」。如下图:

1、 特征选择期:选择用户哪段时间的行为作为模型的特征。当然,不同产品的特征选择期会有不同,但核心宗旨基本一致:可度量出用户在特征上的时间趋势,一般而言,1-2个月的特征选择期较为合适。

2、 空档期:空档期指留给业务同学实施策略的buffer期,当然,并不是所有流失预警模型均需要,由业务方来决定。

以上图为例

我们选择了1月1日 至 1月31日的全量用户作为用户样本,来预测未来30日用户是否可能会流失,假设业务方每次需要7日来评估预测并制定匹配策略,也就是2月1日 至 2月7日,则该模型预测需跳过此7日,预测从2月8日 至 3月7日用户是否可能会流失,从而将中间的7日作为业务空档期。

3、 预测期:预测用户在未来时间段中是否可能会流失。预测期时间的选择,类似于信贷过程中经常使用的迁移率和滚动率的方式,此处我们可以采用N日内留存曲线,根据拐点理论(肘部法则)并结合业务特性来制定相应的预测。

例如:根据业务N日内留存曲线,从30日开始,留存率趋于平稳,则我们可以取30日作为预测期。(如下图)

这里大家要注意!预测期时间越长,流失预测的置信度越高,时效性越差;时间越短,置信度越低,时效性越好。因此需要同时兼顾准确性及时效性因素,一般而言,15-60日内相对较为合适。

问题二:用户流失原因是什么?

了解用户的真实流失原因,对于「模型设计」和「召回策略」来说都是非常重要的。

对于「模型设计」而言

可以有针对性的设计特征,从而更精准的进行预测。

举个例子

对外卖场景而言,假设某个用户离开的真实原因是由于骑手多次延迟,导致用户在线上进行投诉,且投诉之后没有得到很好的反馈。针对这个例子,我们可以衍生出来几个指标用于预测用户流失:派送次数、投诉次数、投诉解决比例等。

对于「召回策略」而言

可以有针对性的匹配召回策略。

举个例子

同样是外卖场景,假设有个用户属于“薅羊毛”类用户,离开的原因是由于平台不再发优惠券了,那当我们了解了用户的诉求之后,再次发放优惠券召回的可能性大大高于其他策略。

由此可见,了解用户流失的真实原因是至关重要的,以下为用户可能流失的内外部因素,大家可以参考(以搜索型场景为例,不同类型APP会存在差异)。

04

模型搭建环节

在对流失用户定义清晰,以及了解用户可能的流失原因后,就可以开始搭建流失预警模型了。模型搭建的核心环节大体分为两步:「特征工程」及「模型搭建」。

步骤一:特征工程

机器学习中有这样一句话,数据质量及特征决定结果的上限,而模型的选择和改进只是不断逼近这个上限。由此可见特征工程的重要性。特征工程细分下来分为以下几步:

我们将重点放在特征引入上,2-4的内容感兴趣的同学可以网上搜索,通用的概念及应用会非常多。我们以外卖场景为例,看看可以总结出哪些特征用于模型预测:

除了上面的静态特征之外,还需要关注趋势类特征:

根据以上信息,我们基本可以度量用户在过去一段时间在APP上的应用行为,当然,不同类型APP的特征会存在一些差异,核心思路:选择的特征均是对用户一段时间的刻画,并且在业务上对预测有所帮助。

步骤二:模型搭建

流失用户预测属于二分类问题,input特征,output用户是否会在未来时间段留下来(0/1)。其中,逻辑回归、SVM、树模型、深度学习等模型均可以解决此类问题,具体的代码实现方式,本篇就不再展开。这里强调两个注意事项,大家需要重点关注:

其一:用户分层预测

很多同学在做用户流失预测的时候,常常将所有的用户数据一同灌入模型,得出预测结果。但这样做往往会遇到一个问题,就是预测出来的流失用户,更偏向于低活,而高活用户预测流失召回却基本为0。所以为了避免这样的问题,可以将不同活跃度用户分别搭建模型。

那这里就引出另外一个问题,活跃度如何进行等级划分,一般而言,等级可分为高活、中活、低活、游离用户,而划分的标准则是依赖于用户过去N日应用天数进行的阈值划分,并且尽量保证划分的均衡。

举个例子

用户过去30日中,游离用户:1-2日;低活用户:3-7日;中活用户:8-20日;高活用户:21-30日。

这样划分固然没有问题,但是不够精准,例如:在过去30日内,一位用户是在最远期来过1天,另一位用户是在最近期来过1天,如果按照上述的计算方式,活跃程度是一样的,然而在流失预测中,显然后面的这位用户相对的活跃程度更高,流失的可能性也更小。

因此可以采用 天数 + 权重 的方式计算活跃度,例如下图,越靠近预测期,权值越高,具体的权重值可根据不同的业务而定。

其二:模型正负样本数量选择

训练中正负样本的选择,会直接影响到最终模型的准召。因此,可根据业务判断是否需要调整训练样本的配比问题。高成本的召回策略(消费券发放)更关注流失预警的准确率;高覆盖的召回策略(端内Push)更关注流失预警的召回率。

当然,除了可以调整正负样本,也可以根据预测出来的置信度进行控制,高成本召回策略只筛选置信度>90%的用户进行投放。

以上就是本期的内容分享。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-03-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 小火龙说数据 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
短信
腾讯云短信(Short Message Service,SMS)可为广大企业级用户提供稳定可靠,安全合规的短信触达服务。用户可快速接入,调用 API / SDK 或者通过控制台即可发送,支持发送验证码、通知类短信和营销短信。国内验证短信秒级触达,99%到达率;国际/港澳台短信覆盖全球200+国家/地区,全球多服务站点,稳定可靠。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档