前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >如何利用Excel对公众号阅读量进行预测?

如何利用Excel对公众号阅读量进行预测?

作者头像
张俊红
发布2021-01-18 11:02:28
6850
发布2021-01-18 11:02:28
举报
文章被收录于专栏:张俊红张俊红

刚开始写文章的朋友们估计都会很关注自己文章的阅读量,毕竟辛辛苦苦码出来的字还是希望更多的人看到。我记得我刚开始写文章的时候,在文章发出去以后隔一会就会去公众号后台看一下阅读量,隔一会看一次,不知道有多少写文章的朋友刚开始也会这么做。

作为一名分析师(算卦的),我就想着能不能对公众号的阅读量进行预测呢?如果在发文后能预测到公众号最终的阅读量,那么其实就没必要每过一会就去看一次后台,因为你已经知道了最终结果。

那应该如何预测呢?我们先来探索一波,如下是我公众号后台某一天的分时阅读量趋势图,可以看到不管是分时阅读量还是分时累积阅读量的趋势性还是很强的。

看到这里就会有两个预测方向,一个是去预测每个小时的分时阅读量,另一个是预测每个小时截止到当前的累积阅读量。

累积阅读量会相对比较好预测,可以看到,累积阅读量的趋势是符合对数分布的,直接在Excel中添加对数分布的趋势线,和真实的累积阅读量趋势是完美重合。

那分时阅读量该如何预测呢?分时阅读量是比较符合幂函数分布的,同样在Excel中添加乘幂趋势线,和真实的分时阅读量趋势线也是完美重合。

上面的趋势线都是有了每个小时的完整数据以后拟合出来的,但是文章开头有说过,我们希望在发文后不久,比如一个小时后就可以能够预估出当天的总体阅读量,这个时候只有一个点是没法去拟合趋势线的。

那应该怎么办呢?答案就是可以用历史相同发文时间的阅读量趋势来代替当天的阅读量趋势。再根据业务经验可得,阅读量随着发文时间的推后,肯定是按照某个比例在进行衰减,这个衰减的速度在不同天应该是近似相等的。不同天或者不同类型文章在不同时段的绝对阅读量会不一样,但是时段与时段之间的衰减速度应该是一致的。基于此,所以我们最后选择了乘幂分布的分时阅读量预测。

我们随机挑过去三天的分时阅读量数据进行乘幂分布拟合,最后得到3个不同的模型:

y = 478.19x^{-1.01}
y = 421.90x^{-0.91}
y = 555.67x^{-0.98}

通过上面的拟合结果可以看出,幂函数的常数项基本约等于发文一小时的阅读量,x为发文后的小时数,指数约为-1,所以我们可以粗劣的将发文一小时后的阅读量预测模型设定为:

y = v*t^{-1}

v表示发文后一小时的阅读量,t表示发文后的小时数,y为发文后t小时的阅读量,最后当天总阅读量就是把不同t对应的预测值加起来即可。

上面的模型是拿我公众号后台数据训练得到,不同公众号,不同文章类型的模型结果可能略有偏差,但是思路大体一致。

该篇文章虽然以公众号阅读量预测为例,但是方法同样时也适用于其他场景下的预测,比如分时段销量预测。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-01-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 俊红的数据分析之路 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档