这是篇论文的笔记,记录阅读该论文中的一些体会,希望与大家一起学到知识。论文题目为《Using neural networks for click prediction of sponsored search》。
文章的核心思想是利用人工神经网络+决策树的方法去进行点击率的预测。
该模型主要是有两个阶段:
人工神经网络能够获得特征之间的非线性关系,同时,深度的结构拥有更强的建模能力。
主要的机制是依靠关键字拍卖:广告商对一系列挑选好的关键字竞价。当一个用户输入一个查询时,搜索引擎与所有的关键字匹配,并挑选合适的广告展示出来。
挑选广告的机制简单来讲如下:第一,根据用户的查询,根据期望收益选择较为匹配的广告,并对广告进行降序排列;第二,最匹配的广告(最多三个)被选择出来,并按照他们的竞价排序然后展示出来。
在CTR的特征处理中,要处理的特征都是高维且稀疏的特征,论文中提供了如下两种方法处理:
对于ID-based特征,首先使用One-Hot编码,产生的特征空间是高维的,而且是稀疏的,主要的降维方法有两种:
主要是利用深度学习的概念。
参考论文:Using neural networks for click prediction of sponsored search