专栏首页App渠道推广识别App数据造假渠道的分析方法
原创

识别App数据造假渠道的分析方法

俗话说,有钱能使鬼推磨。为了保障下载量、使用量,企业通常会在 App 推广中投巨资给第三方渠道,用于引流买量。但在这一过程中,内鬼、羊毛党、刷量中介总会趁虚而入,成为刷量造假的核心群体。那么,今天就根据我的经验来谈谈怎么通过数据分析,辨别流量的真实性,揪出异常渠道。

做渠道数据分析的前提是拿到靠谱的第一手数据。数据如果不够准确,那么基于此数据进行分析也就没有任何意义。

渠道推广比较精准的统计平台我以 openinstall 为例,它能程序化生成渠道包以及海量渠道推广链接,各个渠道只需拿着对应的专属链接即可获取相应数据,即便是用户个体间的社交分享传播,也能实现自动识别渠道分享来源。

数据获取只是万里长征第一步,防作弊分析才是重中之重。目前市场上的作弊方法很多,作弊工作室可能采用分布式人肉刷量的方式来刷量(可以参考基于任务奖励形式的积分墙);也有可能采用更为智能的方式,通过编写程序脚本,修改真机参数,驱动真机运行。这些行为已经跟真实的用户行为几乎没有差别了,很难从技术上分辨这些数据。但我们还是能从数据上分析出一些蛛丝马迹,下面就讲讲具体的辨别方法。

一、先做渠道排重

第一步,先利用现成的工具和系统,从技术上将重复多余的数据剔除,现在许多第三方基于不同的方案,都有一套自己的排重机制,比如 openinstall 后台就能提供免费的排除重复功能,主要维度包括:安装量、注册量、1日/7日/30日留存、增长趋势、IP 分布、系统版本等,也可以根据业务需求自定义目标事件,精准的排重功能可以帮我们做一个初步数据筛选,也为后面的分析环节省去不少工作量。

二、渠道效果评估

1、留存率判断

从留存率看刷量的话,最简单的判断是观察1日、7日、30日这三个节点的数据波动,不少刷量工作室会选择在这三个节点定时导入或者批量导入大量用户数据。所以,如果在没有外在因素影响的情况下,数据出现过高或过低的波动,那么该渠道就有作弊嫌疑。

真实的用户留存曲线应该是平滑下降的,如果一个 App 的次日留存率能达到40%的话,那么7日留存率达到20%,30日留存率达到10%,这个 App 的留存率就高过业内标准了,需要警惕。一般高频类 App(如社交、外卖、工具类)留存率会大于低频类 App(如租房、旅游、电商类),其次,如果有签到奖励、沉默唤醒机制的 App 留存率或许会高一些,这些因素也要考虑进去。

2、终端设备判断

用户终端可以准确追踪到的包括:IP分布、系统版本、品牌/机型等,这些都有分析技巧。

IP分布关系到投放策略层面,一般我们都会根据产品调性做重点投放,比如一二线高消费城市、三四线等相对下沉城市,或者根据区域,比如华东、华南或省份等。查看数据时,如果有部分用户来自重点投放区域外,或者过于集中在某个地区,那么数据来源可能来自某个作弊工作室。

系统版本和操作系统占比也能看出些猫腻。事实上很多作弊渠道都是统一采购作弊设备,毕竟如果一直换新手机作弊成本也太高了,但真实用户不是,因此如果观察到的版本和系统都是比较落后的版本,或者是过于集中在某个时段的版本,那可能就有问题,比如现在2019年,而来自某个渠道的用户机型和操作系统基本都是2017年6月份发布的新机,那就值得怀疑。

品牌机型也是同理,尤其是 iOS 没有模拟机,必须用真机触发,因此刷量作坊会大量采购二手苹果手机,安卓方面,出于成本考虑,主要的刷量也都是由低价机、二手机、冷门机型完成,这些都是可以辨别的依据。

3、用户行为判断

即便如今的作弊工作室能模拟出连系统都无法辨别的逼真行为数据,但访问页面、使用时长、访问间隔、使用频率这些实际行为是很难和真实用户一模一样的。

想要辨别的话,一是跟日常数据做比较,在没有活动或重大更新之类的影响下,真实用户的行为数据应该是趋向平稳的,这个能从某个页面的访问或功能使用时长判断;二是参考权威数据,应用宝之类的应用市场或第三方评测平台,会根据市场大数据定期发布用户行为报告,这个也是参考标准之一。

4、转化率分析

分析一个 App 的流量转化率,不仅能帮助我们提高投放效率,还能判断引流渠道的价值。

通常用户行为都是可以做成漏斗模型的,我们可以把“访问-下载-安装-打开-注册-付费”等行为步骤做成沙漏,每经过一层,作弊难度就会大幅增加,观察每一层转化的异常,可以对渠道质量得出一个大致的结论。

以上这些方法在实际运用中还有很多发挥空间,可以自行根据产品性质做出调整,跟作弊行为斗智斗勇,是每个 App 推广中必须经历的,这些就需要经验积累和工具辅助运用才能实现。

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 【iOS/Android】App渠道推广统计及用户关联

    “我在广告上的投资有一半是无用的,但是问题是我不知道是哪一半。”这是百货商店之父约翰.沃纳梅克一百多年前提出的广告界“哥德巴赫猜想”。

    走在河边的小鹿
  • App自动绑定用户关系和多渠道来源

    这几个问题相信也是困扰大多数运营者的难题,用户在App内的使用体验不仅影响App的下载和活跃程度,还关系到核心业务的运营情况。

    走在河边的小鹿
  • DeepLink唤醒App的简单实现方法

    DeepLink(深度链接技术),一般是通过Web页面调用原生App,并把需要的参数通过Url的形式传递给App,主要使用方式有:两个App之间的广告、App的...

    走在河边的小鹿
  • 大数据时代媒体如何挖掘用户

    12月19日的“2014中国互联网企业领袖年会”上,就大数据在时代媒体如何挖掘用户、如何进行营销创新等实际操作问题,知名财经网站的相关负责人就各自经验和心得进...

    腾讯研究院
  • Dropbox存储架构:扩展至EB级别的实践

    多年前,我们将 Dropbox 称为“魔力口袋”,因为它设计的初衷就是让用户将所有文件放在一个顺手的地方。一路发展下来,Dropbox 已经从一个简单的东西发展...

    CSDN技术头条
  • 用《复联3》的豆瓣评分教会你正确使用条形图、饼图、漏斗模型

    导读: 每天跟数据打交道,或许你已经习惯了用数据说话。怎样能让人更懂你的数据?图表是展现数据的有效方式,几种最常见的图表你都会用了吗?基于图表和数据的常见分析方...

    华章科技
  • win10 uwp Markdown 输入需求文件文件格式文件类保存设置界面拼写检查云创建Html创建pdfGit

    输入标题方式可以使用快捷键,也可以手动输入“#”,一个“#” 表示一级标题,两个个“#” 表示二级标题,三个“#” 表示三级标题,其他表示多级标题。

    林德熙
  • [译] 更好地将免费用户变成订阅用户的小窍门

    Android 开发者
  • 「企业合规」开发符合GDPR标准的应用程序的15个步骤

    引入欧洲在线数据隐私法将对组织如何处理和管理其用户的个人数据产生重大影响。该法律于1月份通过,将于2018年全面颁布。对于定期处理为欧洲公民提供服务的客户或个人...

    首席架构师智库
  • 推荐算法的介绍,第一部分——协同过滤与奇异值分解

    推荐系统是指能够预测用户未来偏好项目(item)并推荐最优先项目的系统。现代社会之所以需要推荐系统,是由于互联网的普及,人们有太多的选择可供使用。过去,人们习惯...

    AiTechYun

扫码关注云+社区

领取腾讯云代金券