专栏首页互联网数据官iCDO生命不息,作弊不止:怎么发现自己的流量被人做了弊?

生命不息,作弊不止:怎么发现自己的流量被人做了弊?

本文长度为2765字,预估阅读时间7分钟

引言:这是一个永恒不灭的话题。技术的进步增加了广告投放的效率和效果,也带来了更加凶猛的作弊。品牌广告的作弊一直以来被人诟病,效果类广告的虚假流量其实也很猖獗。线上营销的成本不停升高,再加上流量掺水作假,对广告主而言,不啻为一个黑暗的考验。

作者 | 宋 星

编辑 | 华 子

到底作弊有多厉害?

AdMaster刚刚发布了2018年上半年的数字广告无效流量白皮书。数据显示,2018 上半年,上千家广告主企业(行业范围涵盖快消、母婴、汽车、餐饮、金融、互联网等各行各业),无效流量占比为 28.8%,同比 2017 年上半年无效流量的占比 29.6%和 2016 年上半年无效流量的占比 30.4%,虽逐年有小幅下降,但形势依然严峻。

接近三分之一的流量是有问题的流量。

而流量的来源上,垂直门户一直都是重灾区。再加上今天的网民行为的迁移,垂直门户的日子只会越来越难过。

媒体行业细分来看,还是品牌类广告行业的无效流量占比多。而且,女性相关媒体的流量情况触目惊心,接近50%!汽车行业媒体的流量作弊有所抬头。

与常识不同,AdMaster给出的移动端的作弊少于PC端。但并不奇怪,因为AdMaster监测数据主要覆盖的是品牌广告主,尤其是视频贴片+信息流+开屏等广告。如果包含了其他的移动端ADX以及效果类的广告,从我们投放的经验上看,移动端的作弊,尤其是安卓系统的作弊,比PC端严重太多。所以下面的这个数据,请大家注意不是移动端的所有流量的数据。

发现效果类作弊

发现效果类作弊只要牢记几点,其实并不困难。

1. 对流量的细分标记一定要做好。

你不做细分流量,怎么发现什么流量有问题呢?

细分流量一般有两种方法,最常用的是link tag的方法(见我这篇文章:Google Analytics的Link Tag http://www.chinawebanalytics.cn/google-link-tag/深入了解流量来源(广告)的质量),现在已经是流量行业的标配。

另外一种方法,是直接给每个不同的流量不同的落地页,不想做不同页面的话,同一个页面不同URL即可。同样可以区分出不同的流量。这种方法用得少,但是在不能给流量做link tag的时候,这个方法很解决问题。

2. 查看各个细分流量的用户行为。

这些行为已经不能只是透过简单的跳出率来查看了。原因看我这篇文章:时光流逝,互联网运营的经典指标还剩下几个?www.chinawebanalytics.cn/times-fly-and-kpi/

我们需要看更加具体的用户的行为,诸如点击的分布,设备的分布,地域的分布,时间的分布,互动时间与参与状况等。显然,大部分效果类的作弊,都很难真正的模拟人的行为,所以,发现作弊其实真正无敌的方法,就是看这些流量的行为是不是“真人”。没错,利用一定的方法,你肯定能分辨出来。具体看我这篇文章:信息流投放没效果?可能不是你自己的问题!www.chinawebanalytics.cn/xinxiliu-traffic-secrets/,在这篇文章中,你会看到出现严重问题的流量是怎么被发现与证实的。

3. 查看流量的行为演进过程。

作弊流量和低质量流量的共同特征,就是它们不会往交易的更深处“演进”。对于转化需要多个步骤完成的业态,这个方法尤为有用。这些流量集中在落地页,但是停留在这里,不再继续发展。这些流量背后一般不是机器,但垃圾无效流量较多。

行为演进的细分与分析,还能够帮助我们发现一些客户端的劫持。典型特征是,当流量演进到购物车或者支付环节的时候,就不再继续进行下去了。而另外一些流量则莫名其妙的以购物车或者支付环节为落地页。

不过,有一类效果作弊基本上没有办法能够被找出来,即互联网基础通信服务端发起的劫持。唉,当一个流量一出现的时候,就已经被人从头到尾改换了门庭,而且还是从互联网基础设施的角度改换的。那就真心没办法能查能堵了。正因为如此,这一类作弊,是目前效果类作弊的最严重的,屡禁不止呀(关键也没有任何强力机构会禁止这种抢钱行为)。虽然说你不能真正发现这类作弊,但还是可以“能感觉到”。比如,当你真的停掉那些ROI很差或者“毫无作为”的流量了以后,那些看起来本来很好的流量渠道也应声下降。

发现品牌类作弊

品牌类的作弊,按照AdMaster上面的数据,大约三分之一的流量有问题。

品牌类的作弊的发现,较效果类要困难。直接原因,品牌类广告的目标是影响消费者的心智,而不是直接作用于消费者的行为。

可是,直到今天,也没有什么特别有效且高效的方法去衡量消费者的心智变化。因此,品牌类广告的投放,在作弊方面天然“有优势”。

发现品牌类投放的作弊流量,主要有如下方法:

1. 查看Click和Impression的频次。

Click的点击频次应不高于1.1,而1.2以上基本上存在很大问题了。Impression的频次作为指针相对比较弱,但如果发现有局部IP普遍频次超过10,那么虚假的可能性也很大。

2. 与效果类类似,如果流量有落地(网站、app、小程序之类),那么查看流量的行为。

这一块,我经历了有很多有意思的故事。比如,早些年,某些垂直媒体贡献的流量极为巨大,但是跳出率极高。若干年后,有一些不明渠道的“运营商弹窗”流量,也是每天海量流量,但是却几乎没有任何在页面上的行为。

还有很多app的下载推广,app确实也下载了,可是从来没有见过激活。或者激活了,从来没有见过使用。这些都是典型的机器流量。

3. 利用第三方黑名单。

比如,AdMaster有这样的黑名单,在对广告进行监播的同时,会查看浏览广告或者点击广告的IP、device ID、cookie等。这种方式目前也是主流的发现品牌端作弊的方式。

至于怎么知道这些IP、device ID或者cookie后面的流量是作弊的,主要的原因在于,这些监测第三方收集的数据比广告主要多很多,因此,更容易察觉出异常的行为。

图:上图是AdMaster的一个案例,关于作弊流量的cookie与IMEI号的特征

4. 借助具有公信力的第二方DMP。

如果能够拿到广告投放之后的覆盖人群的device ID或者其他ID,那么你也可以将这些数据上传给阿里品牌数据银行或者腾讯DMP之类的第二方DMP(请注意,很多人认为他们是第三方DMP,但实际上中国基本上没有严格定义上的第三方DMP,如果大家感兴趣这个话题,欢迎到我这个课程上聊:宋星深度公开课:数据和大数据驱动的智能营销与运营(8月19日北京)www.chinawebanalytics.cn/beijing-big-data-marketing-20180819/)。之后,你能看到这些人群的ID与第二方DMP的ID匹配率往往很低,而且就算有匹配,人群的数据也完全驴头不对马嘴。

5. 爬虫。

这个方法主要用来检查那些定向投放的视频广告是否“作弊”。简单讲,视频广告尽管一般不会提供固定的广告位保证,比如我要投放某个节目前面的前贴片,这种媒体是不会承诺的,但是媒体还是会承诺节目类型,比如投放在美剧,或者投放在社会新闻之类。不过,媒体不会提供具体的投放位置的URL。解决这个问题的方法很简单,第三方追踪广告投放环境(页面)的URL,并且分析这个URL页面具体的内容是否与承诺的节目类型的内容符合。

上图:通过爬虫爬取投放广告的页面的内容,与实际承诺的投放定向内容相比较(来自AdMaster的案例)

这种方法其实对于程序化广告的投放基本上都是比较适用的,本质上程序化投放的品牌安全性也是来自于这种方法。

6. 移动端:利用其他硬件识别信息。

这个方法也需要第三方帮助,但是道理很简单:作弊设备不会随着人到处跑,因此它们的硬件识别信息,尤其是网络环境相关信息、LBS相关信息等,基本上处于永远不变化的状态。这样能够帮助发现可疑设备。

7. 反模拟器与反肉鸡流量。

另外一些作弊用的模拟器或者肉鸡之类。模拟器和肉鸡仍然是机器,因此,它们的行为与人的行为实在有太大的差别。但由于品牌广告的投放,有时候并不看受众的行为——只是为了获取曝光,那么这种情况下,仍然需要依赖于第三方帮助识别。第三方识别这些肉鸡的方法有几种,包括利用特征库做相似性学习(有点类似于机器学习,用现有的肉鸡库或者模拟器库里面的机器行为比对被测流量的行为),做这些流量的行为特征分析(第三方能够有一定的跨域追踪这些流量的能力)等。

总体看,随着流量进入下半场,流量的价格变得更贵,作弊的情况只会变得更加复杂,而不会更加简单。流量作弊识别已经不再是仅仅查看流量访问行为本身,而不得不通过技术把它们作为一个具有更长线行为的“人”来看待,方能知道它们原本“不是人”。

本文分享自微信公众号 - 互联网数据官(internetcdo),作者:纷析数据

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-08-29

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 魔高一丈?程序化广告流量如何作弊

    专栏作家Ratko Vidakovic将为大家阐述关于广告流量作弊的各种方式,希望您在营销过程中能够一眼识破这些诡计! ? 程序化广告领域的流量作弊关系到今天每...

    iCDO互联网数据官
  • 转化与流量到底哪一个更重要?

    梅子,iCDO翻译志愿者 前言:当公司发展到一定程度,把有限的资源投入到引流还是转化是个千年不变的难题,本文作者通过几个简单的例子,告诉我们他的思考和经验。 为...

    iCDO互联网数据官
  • 【实战101】手把手教你寻找并排除虚假异常流量!

    引言:本文结合了作者丰富的互联网数据分析实战经验,深度剖析了如何运用GA来发现,分析并排除虚假和异常流量。

    iCDO互联网数据官
  • 每天一算:Reverse Linked List

    五分钟学算法
  • idea new web project maven jetty

    0.转载自http://blog.csdn.net/qwdafedv/article/details/79448332

    qubianzhong
  • 史上最详细的新浪广告系统技术架构优化历程

    内容来源:2017 年 08 月 10 日,新浪广告开发技术专家徐挺在“第二届APMCon中国应用性能管理大会【大规模网络架构优化专场】”上进行的《新浪广告系统...

    IT大咖说
  • Android流媒体开发之路一:Camera2采集摄像头原始数据并手动预览

      其实主要就是在不预览的情况下获取到摄像头原始数据,目的嘛,一是为了灵活性,方便随时开启关闭预览,二是为了以后可以直接对数据进行处理,三是为了其他程序开发做一...

    hbstream
  • No module named ‘SerialClient‘和Cannot import package : rosserial_arduino

    zhangrelay
  • Rstudio Server + Docker + tensorflowR - 云端安装与使用R语言与GPU深度学习

    版权声明:博主原创文章,微信公众号:素质云笔记,转载请注明来源“素质云博客”,谢谢合作!! ...

    素质
  • NeurIPS 2019民主大实验:提升审稿质量、避免“搭便车”,这回都听你们的!

    在过去五年中,NeurIPS参会人数增长了三倍。今年,通过初审的投稿论文数量达到6743篇(在正式通知收稿6614篇),总计4500多位审稿人撰写了20000多...

    新智元

扫码关注云+社区

领取腾讯云代金券