相关图文Xmind、PDF、视频讲解、代码,请参阅语雀地址:https://www.yuque.com/chudi/tzqav9/ny150b
问题本质:如何利用side information 信息,去构造 feature-based 的model
LR
GBDT
FM
FFM
相较于FM模型,FFM模型引入了域(Field)的概念,可看做是对特征进行分组。例如,对于性别特征而言,通常有两种取值,对值进行one-hot编码之后性别特征会拆分为两个独立的特征。显然,这两个特征具有共同的性质:都属于性别。所以可以将这两个特征归在同一个Field下,即有相同的Field编号。不同域的特征之间,往往具有明显的差异性。对比FM中的做法,每个特征有且仅有一个隐向量,在对特征 xi与其他特征进行交叉时,始终使用同一个隐向量 Vi
公式
- 其中 f为域(Field)映射函数,fi表示为xi特征对应的Field编号。将公式对比FM可以发现,二者之间的差异仅在于二阶交叉对应的隐向量。设数据集中Field的数目为 F,那么对于每个特征 xi拥有 F个对应的隐向量,分别应用于与不同域特征进行交叉
实现
优点
缺点
超参数对于模型的影响