总体上看,按照计算框架的不同,这些受众定向技术可以分为3种类型:
以上各种定向中,地域定向、频道定向和上下文定向属于t©的定向方式;人口属性、行为定向属于t(u)的定向方式;重定向和新客推荐属于t(a,u)的定向方式。
从打标签的方法上看,上下文定向主要的几种思路如下:
行为定向:根据用户的历史行为进行挖掘的方法。具体可以描述为,根据用户一段时期内的各种网络行为,将该用户映射到某个定向标签上。
行为定向问题的目标是找出在某个类型的广告上eCPM相对较高的人群。通常把某个用户在某类广告上的点击量作为建模的对象。
由于点击行为是离散达到的随机变量,对其数量最自然的概率描述是泊松分布:
其中,h为某个用户在某个定向类别广告上的点击量,t代表某个受众标签,而
为相应的控制点击行为到达频繁性的参数。这里的点击量为单位有效展示对应的点击数。行为定向模型要做是把用户的行为与频繁性参数
联系起来。利用线性模型联系用户行为和
,有:
其中wt为标签t对应的行为定向模型需要优化的参数,n表示不同的行为类型,如搜索、浏览、购买等。这里将原始行为b先经过特征选择函数
,再将结果作为特征用在模型中。
行为定向特征的生成过程有两点需要讨论:一是特征选择函数xtn的确定;二是对应模型的训练集的组织和生成方式。
最常用的特征选择函数
是将一段时间内的原始用户行为映射到确定的标签体系上,同时计算出各行为在对应标签上的累计强度作为模型的特征输入。
一段时间内的行为选择,可以使用滑动窗口法和时间衰减法。
行为定向的训练过程实际上是调整各个标签类别上各种特征权重的过程。影响训练结果和效率的主要因素有两个:
计算线性函数
的值,然后根据预先确定的阈值来确定某个用户是否该被打上某个定向标签。使用时间衰减特征累计方法的计算公式:
以用户的行为为基础自动预测人口属性。
通过部署在媒体上的代码或SDK收集第一方访问日志,送入数据高速公路。同时通过数据高速公路收集自有的第二方数据,然后把这些日志原始行为映射到结构化或非结构化的受众标签体系上。还会有一些地上那方提供的加工好的标签数据直接进入用户标签集,在通过统一的接口对外提供。
DMP还有一个技术问题:如何将用户标签传送给购买方,如DSP。包括两个环节:用户身份对应,即cookie映射;数据的传送方式,直接通过在线缓存的形式访问,还是附着在询价请求上直接提供。