专栏首页数据冰山KOL慎入!你粉丝没了

KOL慎入!你粉丝没了

你是品牌方营销人,经常去找网红经纪人买流量。你老板看了最近刷屏的丑闻,特别嘱咐你「千万别花冤枉钱」。现在你有个内容,经纪人推荐了几个微博KOL,你该把钱花在谁身上呢?

本文教你如何目测水军,估算微博网红干粉流量,帮你用大数据砍价,跟老板不拍脑袋拍胸脯。

背景:水灾泛滥

微博上大明星动辄上亿粉丝,小网红也是百万起步。但是水军泛滥,真假难辨。上个月那位倒霉的老板,找微博美妆KOL@张雨晗YuHan做营销。一个观看量353万次的视频,带来的销售额竟然是0 !(参考原文

正可谓:

众生加班皆痛苦,

最苦不过营销主,

辛辛苦苦做推广,

找了大V做流量,

微博指标蹭蹭涨,

唯独销量没增长,

环顾四周心茫然,

钞票百万付汪洋。

面对这汪洋大海,怎么才能甩干脱水,估测KOL的真实粉丝数量,让营销小伙伴不花冤枉钱呢?本文分享三步脱水法,来估测微博网红的真实粉丝数量。

  • 脱僵尸水
  • 脱被屏蔽水
  • 脱扎堆水

样本选择:三干三湿

为了展示估测效果,我们进行了「干网红」和「湿网红」的数据对比。干网红数据,我们选取三位用公认水军较少的微博流量担当:微博CEO「来去之间」、福原爱和吴京。湿网红数据,我们通过业余水军朋友的内部情报,确认了三位经常买水的KOL,都是过百万粉丝的美妆KOL。名字先匿掉,免得收到律师函。我们爬取了这「三干三湿」近三个月的博文和评论数据进行分析。

第一步:脱僵尸水

如果你会玩「博文头条」推广工具,你已经知道里面暗藏了微博平台的警告:

不是所有的粉丝,都是可投的粉丝。

这个工具在哪呢?

打开微博移动客户端,找到你自己任何一篇博文,点击右上方三个点「...」,弹出页下方有带小喇叭符号的「推广」。点击「推广」-「指定账号粉丝的相似用户」,我们就可以查询某个KOL的名义粉丝数和可投粉丝数。比如微博CEO王高飞先生@来去之间 的:

根据@来去之间 的解释,这俩数的定义为:

  • 粉丝数:账号显示的名义粉丝数。
  • 可投粉丝数:微博自动识别出的最近有登录行为的活跃粉丝数。

所以,这两个数字的差,就是僵尸粉。

我们查一下另外5位KOL及@张雨晗YuHan的表现。

这里我们定义:

活跃粉丝率=可投放粉丝数÷页面粉丝数

用来比较这七个KOL的粉丝活跃程度:

先看干KOL,@来去之间的活跃粉丝率高达70%。而吴京和福原爱活跃粉丝率在20-30%,但瘦死的骆驼比马大,「可投粉丝」还是百万级。三位美妆湿KOL的活跃粉丝率比三位干KOL低了一个数量级。最惊人的是上次流量丑闻的主角@张雨晗YuHan的,区区0.3%的活跃粉丝率,比干KOL低了两个数量级。如果品牌方养成查询「可投粉丝」数据的习惯,这些过分猖狂刷僵尸粉的KOL就没人投了。

学会了这一招,你可能说,那咱们就按可投粉丝付费,不管页面粉丝数不就行了?

呵呵。你以为可投粉丝都是可信粉丝吗?

下面咱们估一估,按「可投粉丝」出价,到底要还再打几折才不算花冤枉钱。

这可太难了。我们打开微博看一看,关于一个账户的粉丝,真的没啥线索。

但是!我们可以用评论区评论的可信度来估算!一定比例的活跃粉丝会与博文互动。真粉丝会互动,水军粉丝也会互动。花钱买来的水军粉静静潜水,KOL经纪人还不干呢。

所以我们假定评论可信率体现了粉丝可信率,可以用「可信率」 x「可投粉丝数」=可信粉丝数,按这个出钱,不是就不那么冤枉了吗?

为了方便理解,咱们后文中 「可投粉丝」 统一命名为 「活跃粉丝」。

那么真粉评论跟水军粉评论有什么区别呢?

区别很多,本文透露两个:

一个是水军粉评论更容易被平台屏蔽。另一个是水军粉更喜欢扎堆评论。接着咱们一步一步脱。

第二步:脱被屏蔽水

微博平台还是很努力的,会尽可能把无脑低级重复水军识别出来,对他们采取屏蔽措施。 (参考链接)

那这个屏蔽结果怎么查呢?

微博虽然把垃圾评论识别出来,然而他们只屏蔽了该评论,这些评论仍然计入页面显示的评论数。不信你跑到一条微博下,人肉翻页,数一下可见评论的个数,是不是低于页面显示的评论数?这个差值就是被屏蔽掉的「垃圾评论」数。

我们选取来去之间和美妆KOL A近三个月评论数大于100的微博,统计页面显示的评论数和未屏蔽的评论数,并引入如下指标:

未屏蔽率 = 未屏蔽评论数 ÷ 页面评论数

来去之间和「KOL A」每篇微博的未屏蔽率跟页面评论数是这样的:

可以看到来去之间的未屏蔽率为60-100%。而美妆「KOL A」,未屏蔽率最高23%,某些博文竟然只有2%,也就是50条评论才显示一条!

接着把单个KOL的多篇博文评论一起算,每位的总体未屏蔽率分别如下:

我们看到,湿网红「KOL A」和「KOL C」的水军评论不太敬业,被平台屏蔽了超过50%。而湿网红「KOL B」在水军评论的仿真度上略胜一筹,躲避了平台的垃圾屏蔽,未屏蔽率赶超干网红。

基于评论数的未屏蔽率,我们可以按比例估算出微博平台未屏蔽的粉丝数。

然而,没被微博屏蔽的评论就靠谱吗?要是KOL买了真人来充水军,微博官方也无从下手把他们干掉,弄不好误伤太多真实用户。

第三步:脱扎堆水

为了剔除逃过了微博官方屏蔽的水军,我们先观察两条微博评论的发布时间分布,

第一张图是来去之间某条微博的评论发布数在时间轴上的分布:

第二张图是美妆「KOL B」某条微博的评论发布数在时间轴上的分布:

我们发现,「KOL B」的评论分布非常密集,并且不具备连续性,热度突然爆发,又突然寂静。这不科学。

真实粉丝发评论的时间分布,博文发布后爆发增长再曲线下降,比如来去之间的数据。而水军评论的发帖时间,取决于水军协调员(「水头儿」)下达任务(和红包)的时间点。一般场景是这样的:经纪人发现流量不佳,会敦促水头儿赶快来一波。水头儿会在水军群中发放红包,完成任务的水军才能抢。这就造成水军评论一惊一乍,扎堆儿发帖的戏路。这出戏早就有台词了,叫:「给个群号,有钱一起赚啊」,简称「给群有赚」。

为此,我们引入一个概念,叫做扎堆度。评论越密集,发帖高潮越不连续,扎堆度就越高。怎么算?我们先以一分钟作为一个时间段,统计每个时间段内的评论数,从大到小对其进行了排列。

参考上图,我们对一条微博评论时间的扎堆度定义如下:

扎堆度 = 头部50%分钟段的评论数 ÷ 全部评论数

这个数在50%到100%之间,数字越大扎堆度越高。

那么什么样的扎堆度正常?什么样的是疑似水军呢?

在我们计算出扎堆度后,可以看到来去之间的扎堆度在0.64。美妆KOL B和C都比他高出了0.15以上。如果我们用来去之间的扎堆度做基准,多出来的评论比例大概率是水军评论,以此比例,可以估算未屏蔽粉丝中的水军比例。以活跃粉丝为基数,扎堆粉丝率定义为:

扎堆粉丝率 = (KOL扎堆度 - 来去之间扎堆度) × 未屏蔽粉丝率

脱水结果

经过三步脱水,剩下的就是可信干粉了。现在看一下各位KOL活跃粉丝中的可信干粉率:

我们可以看到美妆「KOL B」虽然确实买水,指标还不赖,要不然是水军买得少,要不然是水军训练有素,高仿有道。其他两位,买的流量也太多了吧,占了活跃粉丝的七八成。

按活跃粉丝算,你想买「KOL B」,打7折就够了;要买「KOL C」,你就得打3折;哪怕买吴京,你也得打个8折再买。要是想买「KOL A」,不建议你买,她太水了。

如果要看脱水前后粉丝的绝对数,请看下图:

可以看到这些动辄百万粉丝的KOL真正能用的流量,只有60万粉的来总十分之一。营销团队的朋友们,选人的时候,可要擦亮你们的眼睛,别被骗了。

总结

最后我们可以把上述方法总结为「三步脱水法」。依次对以下三个指标进行计算:

  • 活跃粉丝数
  • 未屏蔽粉丝数
  • 可信干粉数

最终的结果是:

可信干粉数 = 页面粉丝数 - 僵尸粉丝数 - 被屏蔽粉丝数 - 扎堆粉丝数

我们的方法不需要知道某个KOL买不买水,只需要根据可投、未屏蔽、不扎堆的表现去估算干粉数,就能知道你在买流量的时候该打几折。

茫茫人海,找靠谱的KOL很费劲。本文虽不能帮你找KOL,但是可以帮你判断KOL靠不靠谱。

当然还有更多的数据维度可以用来评估KOL流量的真实度,此处暂不披露,说多了病毒会产生抗药性,挺好的流感疫苗该失效了!

在识别虚假流量方面,本文方法只是冰山一角。

本文分享自微信公众号 - 数据冰山(shujubingshan)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-11-08

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

推荐阅读

  • 远程办公经验为0,如何将日常工作平滑过度到线上?

    我是一名创业者,我的公司(深圳市友浩达科技有限公司)在2018年8月8日开始运营,现在还属于微型公司。这个春节假期,我一直十分关注疫情动向,也非常关心其对公司带来的影响。

    TVP官方团队
    TAPD 敏捷项目管理腾讯乐享企业邮箱企业编程算法
  • 数据中台,概念炒作还是另有奇效? | TVP思享

    作者简介:史凯,花名凯哥,腾讯云最具价值专家TVP,ThoughtWorks数据智能业务总经理。投身于企业数字化转型工作近20年。2000年初,在IBM 研发企业级中间件,接着加入埃森哲,为大型企业提供信息化架构规划,设计,ERP,云平台,数据仓库构建等技术咨询实施服务,随后在EMC负责企业应用转型业务,为企业提供云迁移,应用现代化服务。现在专注于企业智能化转型领域,是数据驱动的数字化转型的行业布道者,数据中台的推广者,精益数据创新体系的创始人,2019年荣获全球Data IQ 100人的数据赋能者称号,创业邦卓越生态聚合赋能官TOP 5。2019年度数字化转型专家奖。打造了行业第一个数据创新的数字化转型卡牌和工作坊。创建了精益数据创新方法论体系构建数据驱动的智能企业,并在多个企业验证成功,正在向国内外推广。

    TVP官方团队
    大数据数据分析企业
  • 扩展 Kubernetes 之 CRI

    使用 cri-containerd 的调用流程更为简洁, 省去了上面的调用流程的 1,2 两步

    王磊-AI基础
    Kubernetes
  • 扩展 Kubernetes 之 Kubectl Plugin

    kubectl 功能非常强大, 常见的命令使用方式可以参考 kubectl --help,或者这篇文章

    王磊-AI基础
    Kubernetes
  • 多种登录方式定量性能测试方案

    最近接到到一个测试任务,某服务提供了两种登录方式:1、账号密码登录;2、手机号+验证码登录。要对这两种登录按照一定的比例进行压测。

    八音弦
    测试服务 WeTest
  • 线程安全类在性能测试中应用

    首先验证接口参数签名是否正确,然后加锁去判断订单信息和状态,处理用户增添VIP时间事务,成功之后释放锁。锁是针对用户和订单的分布式锁,使用方案是用的redis。

    八音弦
    安全编程算法
  • 使用CDN(jsdelivr) 优化博客访问速度

    PS: 此篇文章适用于 使用 Github pages 或者 coding pages 的朋友,其他博客也类似.

    IFONLY@CUIT
    CDNGitGitHub开源
  • 扩展 Kubernetes 之 CNI

    Network Configuration 是 CNI 输入参数中最重要当部分, 可以存储在磁盘上

    王磊-AI基础
    Kubernetes
  • 聚焦【技术应变力】云加社区沙龙online重磅上线!

    云加社区结合特殊时期热点,挑选备受关注的音视频流量暴增、线下业务快速转线上、紧急上线防疫IoT应用等话题,邀请众多业界专家,为大家提供连续十一天的干货分享。从视野、预判、应对等多角度,帮助大家全面提升「技术应变力」!

    腾小云
  • 京东购物小程序购物车性能优化实践

    它是小程序开发工具内置的一个可视化监控工具,能够在 OS 级别上实时记录系统资源的使用情况。

    WecTeam
    渲染JavaScripthttps网络安全缓存

扫码关注云+社区

领取腾讯云代金券