本篇主要是python实现马尔科夫链归因,关联的文章:
什么是广告归因(Attribution)? -> 广告的转化的产生,其功劳应该归功于哪些渠道。
归因模型是指一种或一组规则,用于确定如何将销售功劳和转化功劳分配给转化路径中的接触点。
归因分析(Attribution Analysis)要解决的问题,就是广告的Conversion的产生,其功劳应该归功于哪些渠道;举个例子,广告主投放了信息流广告,搜索广告,视频广告,转化(Conversion)很多都直接发生在搜索广告中,那么这些Conversion完全是搜索渠道功劳么?其实未必,很多转化都是用户在观看视频广告/信息流广告之后,引起用户注意,而后用户做了大量研究后,最后一次转化发生在搜索引擎渠道中而已。因此,在PC时代,搜索引擎收割各个营销渠道的成果,成为了一个不争的行业秘密。
下面图示意了这个简单的过程,目前大部分人在手机上的时间已经超过了PC时间,虽然手机上的推广对人们会有直接的影响,但这些转化的落地往往在搜索和垂直电商网站。所以,搜索引擎的每一次转化,实际上是和之前渠道的的投放是密切相关的,那么到底有多相关,就是归因分析要解决的问题。
对于广告主和市场营销人员,合理的规渠道营销预算,实现ROI最大的是每个人非常关心的目标,但是面对现今复杂的营销环境,常常会有如下的一些困扰:
这些,归因模型都可以告诉你,借助归因模型,我们可以实现:
参考自文章13
还有文章:【数据分析思维】多因素影响下如何归因?
GA里面的归因模型有非常多种,分为单触点归因和多触点归因。
单触点归因就是讲功能归于首个或最后一个,多触点归因就是讲功能在整个流程上的多个渠道按一定的规则或算法分配。
没有完美的归因模型,任何模型都存在局限性和不足的,现在的营销环境越来越复杂,触发用户的终端设备越来越多,用户从第一次触发到最终做转化决策这个过程并不是模型能够完全,准确概括的。
最后一个渠道获得100%的转化,而不需要考虑用户之前有通过什么渠道进来过的,这种适用于转化时间间隔,转化路径比较短的业务,也就是进来就购买的。或者说,广告目的就是引导顾客购买,起临门一脚作用的。亚马逊广告采用的就是这种模型。
将转化100%归功于最后一个非直接点击进入的渠道,通常直接点击所包含的具体来源的类型是非常多的,如直接点击可能来自收藏夹,直接输入,最热网页,其他难以区分的情况,因为具体的来源难以区分,所以会对数据分析产生影响,为了避免误导,所以将非直接点击排除。如果你的直接流量占比很高的话,这种模型比较实用。
最后一个AD的点击获得100%的转化,强调AD的作用,适用于推广侧重于AD的。
第一个渠道获得100%的转化,这个模型侧重于用户如何发现你的站点的,强调用户的获客,适用于品牌知名度低的。适合新品牌在品牌建设或产品推广初期,打造知名度。
之前听行业内朋友说过,一些美国资深卖家在推广产品初期更喜欢关注对受众的触达率,即曝光量,就是根据这种逻辑进行的。
每个渠道平均分配转化,每个渠道都有相同的功劳,明显具有很大的弊端的一种模型,会造成某些渠道的作用被夸大,而某些渠道的作用被低估的。
**优点:**他是一个多触点归因模型,可以将功劳划分给转化漏斗中每个不同阶段的营销渠道。另外,他的计算方法比较简单,计算过程中的权重调整也比较方便。
**弊端:**很明显,线性平均划分的方法不适用于某些渠道价值特别突出的业务。比如,一个客户在线下某处看到了你的广告,然后回家再用谷歌搜索,连续三天都通过谷歌进入了官网(真实情况也许只是用户懒得记录或者懒得收藏官网地址),并在第四天成交。那么按照线性归因模型,谷歌会总计分配到75%的权重,而线下某处的广告得到了25%的权重,这种情况线下广告的重要性便被忽视了。
根据线性归因模型的特点,他更适用于企业期望在整个销售周期内保持与客户的联系,并维持品牌认知度的公司。在这种情况下,各个渠道在客户的考虑过程中,都起到相同的促进作用。
越靠近转化时间的渠道的功劳越大,这个模型强调了最后一个渠道的重要性的同时没有忽略之前渠道的贡献,符合推广过程中用户会通过多个渠道进来的情形,更容易被广告主和市场人员接受。
时间衰减归因模型基于一种假设,这种假设认为触点越接近转化,对转化的影响力就越大。这种模型基于一个指数衰减的概念,一般默认周期是7天。也就是说,以转化当天相比,转化前7天的渠道,能分配50%权重,前14天的渠道分25%的权重,以此类推……
**优点:**相比线性归因模型的平均分权重的方式,时间衰减模型让不同渠道得到了不同的权重分配,当然前提是基于“触点离转化越近,对转化影响力就越大”的前提是准确的情况下,这种模型是相对较合理的。
**弊端:**这种假设的问题就是,在漏洞顶部的营销渠道永远不会得到一个很高的分数,因为它们总是距离转化最远的那个,这样就会忽略广告在业务增长中的重要性(原因下文会讲到)。
**适用于:**客户决策周期短、销售周期短的情况。比如,做短期的促销,就打了两天的广告,那么这两天的广告理应获得较高的权重。
首尾贡献大,中间平分
为客户首次广告互动以及最终广告互动分别分配 40% 的功劳,将其余 20% 的功劳平均分配给转化路径上的其他广告互动。这种模型非常重视最开始的线索和最终促成转化的渠道
首末归因模型同时兼顾了拉新和转化的业务需求,非常适合那些十分重视线索来源和促成销售渠道的公司。该模型的缺点则是它不会考虑线索转化之后的触点的营销效果。
如果前面的模型都不适合你,你还可以根据自己的业务特征,受众去自定义符合自己的归因模型
根据转化操作的历史数据来分配转化功劳。该归因模型与其他归因模型的区别在于,它使用帐号数据计算每次互动在转化路径中的实际功劳。
不同的业务模式和营销目标决定了不同归因模型的选择
参考:互联网广告的归因分析(Attribution Analysis)
之前看到的传统归因,大多基于规则;
数据驱动归因(Data-Driven Attribution,简称DDA,也叫算法归因)是一种基于机器学习的归因模型,与基于规则的归因模型不同,数据驱动归因使用所有可用的路径数据,包括路径长度,曝光顺序和广告素材,来了解特定营销接触点的存在如何影响用户转化的可能性以更好地将功劳分配给任何接触点。
夏普里值(Shapley Value)指所得与自己的贡献匹配的一种分配方式,由诺贝尔奖获得者夏普里(Lloyd Shapley)提出,它对合作博弈在理论上的重要突破及其以后的发展带来了重大影响。
这里最终计算的值是特征i的重要程度。前面一部分分式表示的是权重, 后面一部分括号内表示的是新增特征i前后的变化值。
我们如何用这个方法来分析不同渠道的贡献度呢? 下面是一个例子,
假设有3个渠道:信息流(A),开屏(B),视频前贴©,他们的独自投放效果和两两投放效果如下图所标识。
下面,我们来计算,每一个渠道的夏普里值,夏普里值的定义:是在各种可能的联盟次序下,参与者对联盟的边际贡献之和除以各种可能的联盟组合。
三个渠道,有3*2种联盟次序,具体计算如下:
因此,信息流的夏普里值为20,开屏的夏普里值为33.3,视频前贴的夏普里值为46.6。
关于shap值计算,也可以参考:数据运营36计(四):互联网广告渠道归因分析之Sharply Value
生存分析(Survival analysis)是来源于医学研究的一种方法,指根据试验或调查得到的数据对生物或人的生存时间进行分析和推断,研究生存时间和结局与众多影响因素间关系及其程度大小的方法,也称生存率分析或存活率分析。这个方法在医疗处理领域也比较成熟,可以通过以下的映射到归因分析;
病人==>Impression
治疗方法==>渠道
死亡==>转化
在实现分析中,可以使用COX回归方法,COX可以对多个因素进行分析;COX回归方法和逻辑回归LR有些相似的地方,通过训练过程找几个参数,不同的是COX回归中考虑了时间的因素;通过COX回归计算,可以算出每一个渠道的权重。
通径分析是进行相关系数分解的一种统计方法。它的意义不仅在于揭示了在多个自变量x1,x2,…,xm,y的相关分析中,xi对y的直接影响力和间接影响力,而且还可以在x1,x2,…,xm,y间的复杂相关关系中,从某个自变量与其他自变量的“协调”关系中得到对y的最佳影响的路径信息,即从复杂的自变量相关网中,得到某个自变量决定y的最佳路径,具有决策的意义。现通过实例说明通径分析的方法与步骤,并进一步了解通径系数的意义和应用。它的本质也是基于概率的一些计算。
在应用当中,序列中的每个点通常映射为一个广告触点,每个触点都有一定概率变成真正的转化。通过这种建模,可以选择最有效,概率最高的触点路径。这种方法需要较多的数据,计算也比较复杂。
那么我们得出各个渠道的重要程度后,我们如何使用这些权重是非常有趣的,因为这些渠道都是相关的,需要程序组合一套方案,达到效果推广最佳。但是,这些影响力实际上也会发生很大变化:
来源:数据驱动归因的几个算法
目前国际一线互联网公司,谷歌系的产品用的是基于Shapley值,如Google Attribution 360,Google Analytics 360,DoubleClick和AdWords,是要付费产品才可以使用,但是在Google Analytics归因工具的测试版里面也可以使用数据驱动归因:
Facebook也有使用归因算法,但并未公布使用的具体算法是哪个,只是说定期更新算法模型,Facebook的是预估增量影响为各个触点分配转化功,且只能衡量 Facebook、Instagram、Audience Network 和 Messenger 上的营销活动,我估计用的是增量模型(Uplift Modeling),这个模型在腾讯和阿里都有应用。
Adobe Analytics是基于Harsanyi Dividend。
国内有些公司使用的是Markov Chain。
相同点:
不同点:
https://www.zoho.com.cn/crm/help/automation/marketing-attribution.html
Zoho CRM中的归因模型类型
Zoho CRM提供六种归因模型,让您在营销活动中获得更好的绩效洞察,优化预算,并让您了解最值得投入的营销活动。在任何特定的时间点,只能选择一个归因模型。在下面的章节中,我们将详细讨论每个归因模型,并帮助您为企业业务结构选择最佳模型。
Google Analysis Suite 360中有一个重要模块就是Attribution,这个产品是收购收购了Adometry公司之后,全新打造的新产品。这个产品使用起来非常复杂,需要专业的培训才可了解。它支持以上大部分归因分配模型,例如Last Model, Decay Model,customized Model等。
来看一下GA里面怎么设置几个模型的:
Google Analytics自定义归因模型详解,个性化你的功劳簿
当然这里有几个额外需要知道的概念:
线性归因模型(Linear)
线性归因模型是按照“平均主义”将功劳分配在每一次互动上。当我们应用线性归因模型作为基准模型时,我们可以自定义的除了回溯期以外还有“根据用户互动度调整功劳”和“应用自定义的功劳分配规则”两个选项。
根据位置模型(Position Based)
这个基准模型也成为U型模型。该基准模型的自定义大致与线性模型相同,不同的是你可以重新定义两头与中间的功劳分配。
Visual IQ是一家全球领先的跨渠道营销归属软件公司。公司在2006年成立。公
司的IQ智能套件可以为用户提供市场数据见解,行政级别和从业级别建议,以提高自己的营销业绩。
Visual IQ是一家专门研究营销信息管理方案、利用数据以及消费者经历的每一个营销触点对一个客户整体营销目标的影响的科学计算和衡量方法的公司。
Visual IQ采用信息管理归纳方案的方法收集数据,然后利用分析模型,计算和量化消费者的购买习惯的方法,去分析数据,整理出最适合企业的广告方案。
Convertro 主要利用数据分析,帮助营销人员了解哪些类型的广告导致了客户的购买。AOL与2014年收购了这家公司,收购时间与谷歌收购Adometry非常接近。AOL可以利用 Convertro 的技术,告诉广告主他们的那些广告取得了更好的效果,例如,是 AOL 网站主页上的横幅广告,还是《赫芬顿邮报》网站某视频下方的广告。Convertro 还可以检测电视或电台那一时段的广告导致了客户购买。
5大原则:
一些案例可见:
GA在模型对比工具中提供以下默认归因模型
现在的营销,越来越多的用户在转化之前已经就接触过我们的广告了,除了转化前最后一次广告的临门一脚,在之前的广告也是对用户转化有促进作用的,怎样才能评估这种类型的广告的效果呢?
这时候就要用到多渠道转化,在GA中选择“多渠道路径”→“热门转化路径目标”,如图2-46所示,可以看到用户最后转化的之前经过了哪些路径(需要注意:查看热门路径报告,进入默认是两次以上的,需要在“路径长度”中选择“1次或更多”才会看到跟下图一样的报告,且对应在转化中要选择一个目标,这里还是选择“在线时长超过10分钟”):
通过这个报告可以知道:
(1)首次转化与多渠道后的转化的比例,如果多路径转化的比例很多,就必要分析哪种类型的最多,之前是通过哪个渠道的,对应的提高该渠道的市场预算,或是有需要做再营销。
(2)一次转化中最高的渠道是哪个,这个就是优质渠道,需要加大投入。
【再说广告归因】强行将“助攻”算做“直接得分”,还要不要脸?
对于种草类平台来说,点击并不是发生转化的必要行为,采用点击归因很容易低估平台的效果。抖音数据显示,有10-25%的用户在看过抖音广告后会去商店或搜索引擎搜索商品信息,从而完成转化。
对于这部分用户来说,抖音广告播放对最终的转化起到了不可忽视的作用。如果采用点击归因,将用户的转化计在最后一次点击上,广告主很容易忽视掉这部分观看了视频广告、并未产生点击,但最终产生了转化的人群,进而容易误导后续投放资源的合理分配。
抖音使用的播放归因是以点击和播放同时作为有效触点,综合评估用户转化行为路径上的广告投放效果。结合平台用户的行为特征及广告呈现特点,此次抖音切换后的播放归因模式选择以3秒播放时长作为评估标准。
今年某手短视频当前场景已调整为有效触点归因逻辑,有做营销增长的同学反馈看到是某手短视频广告的归因数据回传默认是按照播放数据进行回传的。
广告平台在有效触点归因主要动作是将原来只有用户点击广告才将归因信息发给广告主进行归因,调整为“用户点击+有效触点(如播放N秒之后算为有效触点)”也将归因信息发给广告主,归因逻辑如下图:
有效触点归因所带来的影响