practical lessons from predicting clicks on ads at facebook - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

干货|广告点击预估模型经典论文收藏

本文梳理了部分CTR（广告点击预估）模型的经典论文供大家阅读，欢迎在留言区交流，也可以分享你阅读过的经典论文。

02

利用GBDT模型构造新特征具体方法

实际问题中，可直接用于机器学习模型的特征往往并不多。能否从“混乱”的原始log中挖掘到有用的特征，将会决定机器学习模型效果的好坏。引用下面一句流行的话：特征决定了所有算法效果的上限，而不同的算法只是离这个上限的距离不同而已。本文中我将介绍Facebook最近发表的利用GBDT模型构造新特征的方法。（Xinran He et al. Practical Lessons from Predicting Clicks on Ads at Facebook, 2014）论文的思想很简单，就是先用已有特征训练

07

您找到你想要的搜索结果了吗？

是的

没有找到

XGBoost + LR 就是加特征而已

本文介绍了XGBoost+LR算法在工业界的一些应用，以及在CTR预估领域的成绩。作者通过在Criteo数据集上的实验表明，XGBoost+LR可以有效地提高CTR预测的准确度，同时也能够降低算法的计算复杂度。虽然XGBoost+LR在预测效果上并没有达到深度学习的效果，但是它的优势在于算法复杂度更低，更适合于工业界的应用。同时，作者也指出了XGBoost+LR的局限性，例如无法处理非线性和复杂关系，需要更多的特征工程等等。因此，对于工业界来说，需要根据具体的应用场景和需求来选择合适的算法和模型，同时也需要更多的实验和研究来探索更优的解决方案。

08

GBDT、FM、FFM和DNN融合构建广告点击率预测模型

点击率预估用来判断一条广告被用户点击的概率，对每次广告的点击做出预测，把用户最有可能点击的广告找出来，是广告技术最重要的算法之一。

01

CTR预估中GBDT与LR融合方案

1背景 CTR预估，广告点击率（Click-Through Rate Prediction）是互联网计算广告中的关键环节，预估准确性直接影响公司广告收入。CTR预估中用的最多的模型是LR（Logistic Regression） [1]，LR是广义线性模型，与传统线性模型相比，LR使用了Logit变换将函数值映射到0~1区间 [2]，映射后的函数值就是CTR的预估值。 LR，逻辑回归模型，这种线性模型很容易并行化，处理上亿条训练样本不是问题，但线性模型学习能力有限，需要大量特征工程预先分析出有效的特征、特

06

CTR点击率预估论文集锦

CTR预估对于搜索、推荐和广告都是非常重要的一个场景，近年来CTR预估技术更新迭代，层出不穷。这篇文章将记录CTR预估著名模型的相关论文。以下按照年份整理。

02

【Github】深度学习在推荐系统中的应用及论文小结

https://github.com/chocoluffy/deep-recommender-system

04

用DNN构建推荐系统-Deep Neural Networks for YouTube Recommendations论文精读

虽然国内必须翻墙才能登录YouTube，但想必大家都知道这个网站。基本上算是世界范围内视频领域的最大的网站了，坐拥10亿量级的用户，网站内的视频推荐自然是一个非常重要的功能。本文就focus在YouTube视频推荐的DNN算法，文中不但详细介绍了Youtube推荐算法和架构细节，还给了不少practical lessons and insights，很值得精读一番。下图便是YouTube APP视频推荐的一个例子。

03

点击率预测综述 ( 下篇）

05

CTR点击率预估之经典模型回顾

CTR(Click-through rate, 点击率)预估在工业级推荐系统、广告系统中是非常重要的一个环节, 其预估效果会直接影响推荐系统的性能. CTR预估常伴有训练数据量大、特征高度稀疏、推断性能要求高等特点, 使得算法的设计多围绕这些特点来进行. 本文旨在梳理经典CTR预估模型的演化历程, 分为如下几个小节:

02

GBDT+LR：Practical Lessons from Predicting Clicks on Ads

本文主要介绍Facebook提出的CTR预估模型LR(Logistic Regression)+GBDT。当时深度学习还没有应用到计算广告领域，Facebook提出利用GBDT的叶节点编号作为非线性特征的表示，或者说是组合特征的一种方式。

03

一文尽览推荐系统模型演变史

4. 整理此文的目的是给大家一个清晰的脉络，可当作一篇小小综述。从信息过载概念的提出到推荐系统的起源，从前深度学习时代的推荐系统到劲头正热的深度推荐系统，再到最后对于深度学习技术带来的推荐系统性能提升的质疑，每个阶段都是必不可少的。

02

个性化推荐系统从0到1

本文主要介绍了在手机QQ浏览器APP中，如何搭建个性化推荐系统，从而提高用户的点击率和活跃度。主要包括以下几方面：1.基于用户画像的个性化推荐，利用用户行为数据进行建模，实现用户分群；2.结合业务场景，分析并优化推荐效果，提高点击率；3.搭建实时推荐系统，实现快速迭代，提高用户满意度。

02

特征工程系列：GBDT特征构造以及聚类特征构造

关于作者：JunLiang，一个热爱挖掘的数据从业者，勤学好问、动手达人，期待与大家一起交流探讨机器学习相关内容~

03

字段级概率校准，助力推荐算法更精准！

丨导语一年一度的国际顶级学术会议万维网大会 (The Web Conference, 即 WWW-2020) 于 4 月 20 日至 4 月 24 日在线上成功召开。WWW-2020 收到来自全球五十多个国家和地区的超过 1500 篇论文投稿，仅录用长文 219 篇，录用率 19%。其中，由腾讯TEG数据平台部，与中科院计算所、清华大学合作研究的成果《Field-aware Calibration: A simple and empirically strong method for reliable

03

【微信分享】李滔：搜狐基于Spark的新闻和广告推荐实战

7月30日，搜狐大数据中心技术经理李滔在CSDN Spark微信用户群，与近千名Spark技术开发人员，结合搜狐内部的新闻与广告推荐系统，深入分享了团队基于Spark的机器学习实战。 ---- 李滔，中国科技大学博士毕业，现供职于搜狐大数据中心用户推荐部，从事推荐和广告算法研发工作。主要关注技术方向包括广告技术、并行计算、大数据分析等。李滔曾就职于理光北京研究所以及Teradata公司。在理光期间设计了理光相机的第一代人脸检测/对焦系统。之后在Teradata公司从事大规模数据挖掘的算法设计开发，基

02

GBDT原理及利用GBDT构造新的特征-Python实现

Gradient Boosting是一种Boosting的方法，它主要的思想是，每一次建立模型是在之前建立模型损失函数的梯度下降方向。损失函数是评价模型性能（一般为拟合程度+正则项），认为损失函数越小，性能越好。而让损失函数持续下降，就能使得模型不断改性提升性能，其最好的方法就是使损失函数沿着梯度方向下降（讲道理梯度方向上下降最快）。

02

Gradient Boosting梯度提升-GBDT与XGBoost解析及应用

集成学习是机器学习算法中地位非常重要的一类算法, 其拥有理论基础扎实、易扩展、可解释性强等特点, 其核心思想是, 使用弱学习器(如线性模型、决策树等)进行加权求和, 从而产生性能较为强大的强学习器. 若按照指导弱学习器进行学习的理论基础进行分类的话, 集成学习的算法可分为两大类: 1. 基于偏差方差分解和bagging(bootstrap aggregating, 有放回抽样与集成)进行弱学习器学习的算法, 其典型代表是RF(Random Forest, 随机森林); 2. 基于梯度下降和boosting [1](提升)使弱学习器对前序产生的模型的不足之处进行改进, 以达到提升强学习器能力的效果, 其典型代表是AdaBoost(Adaptive Boosting, 自适应提升), GBDT(Gradient Boosting Decision Tree, 梯度提升决策树). 本文主要的阐述对象是第二类, 即基于梯度下降和boosting的算法, 具体分为如下章节:

02

GBDT+LR算法解析及Python实现

本质上GBDT+LR是一种具有stacking思想的二分类器模型，所以可以用来解决二分类问题。这个方法出自于Facebook 2014年的论文 Practical Lessons from Predicting Clicks on Ads at Facebook 。

03

GBDT的原理_gbdt怎么计算特征重要性

Gradient Boosting是一种Boosting的方法，它主要的思想是，每一次建立模型是在之前建立模型损失函数的梯度下降方向。损失函数是评价模型性能（一般为拟合程度+正则项），认为损失函数越小，性能越好。而让损失函数持续下降，就能使得模型不断改性提升性能，其最好的方法就是使损失函数沿着梯度方向下降（讲道理梯度方向上下降最快）。

01

特征工程系列：自动化特征构造

数据和特征决定了机器学习的上限，而模型和算法只是逼近这个上限而已。由此可见，特征工程在机器学习中占有相当重要的地位。在实际应用当中，可以说特征工程是机器学习成功的关键。

02

GBDT+LR算法解析及Python实现

本质上 GBDT+LR 是一种具有 stacking 思想的二分类器模型，所以可以用来解决二分类问题。这个方法出自于 Facebook 2014 年的论文 Practical Lessons from Predicting Clicks on Ads at Facebook 。

02

GBDT+LR算法解析及Python实现

参考：https://www.cnblogs.com/wkang/p/9657032.html

01

【专知荟萃10】推荐系统RS知识资料全集（入门/进阶/论文/综述/视频/代码等）

信息推荐（推荐系统，Recommendation System）荟萃入门学习进阶文章综述 Tutorial 视频教程代码领域专家入门学习探索推荐引擎内部的秘密，第 1 部分推荐引擎初探 IBM developerWorks [https://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy1/index.html\] 探索推荐引擎内部的秘密，第 2 部分深入推荐引擎相关算法 - 协同过滤 [https://www.i

08

干货 | 携程个性化推荐算法实践

作者简介携程基础业务研发部-数据产品和服务组，专注于个性化推荐、自然语言处理、图像识别等人工智能领域的先进技术在旅游行业的应用研究并落地产生价值。目前，团队已经为携程提供了通用化的个性化推荐系统、智能客服系统、AI平台等一系列成熟的产品与服务。携程作为国内领先的OTA，每天向上千万用户提供全方位的旅行服务，如何为如此众多的用户发现适合自己的旅游产品与服务，挖掘潜在的兴趣，缓解信息过载，个性化推荐系统与算法在其中发挥着不可或缺的作用。而OTA的个性化推荐一直也是个难点，没有太多成功经验可以借鉴，本文分享

05

揭秘Facebook增长引擎——深度学习推荐系统

一些最前沿的研究成果大多来自业界巨头的实践。从Facebook 2014年提出的GBDT+LR组合模型引领特征工程模型化的方向开始，业界迎来了深度学习推荐系统应用的浪潮。

02

原创 | 万字长文，剖析经典论文GBDT+LR

今天我们来剖析一篇经典的论文：Practial Lessons from Predicting Clicks on Ads at Facebook。从这篇paper的名称当中我们可以看得出来，这篇paper的作者是Facebook的广告团队。这是一篇将GBDT与LR模型结合应用在广告点击率预测的方法，虽然距今已经有好几年了，但是文中的方法仍然没有完全过时，至今依然有一些小公司还在使用。

03

即时配送的ETA问题之亿级样本特征构造实践

引言 ETA（Estimated time of Arrival，预计送达时间）是外卖配送场景中最重要的变量之一（如图1）。我们对ETA预估的准确度和合理度会对上亿外卖用户的订单体验造成深远影响，这关系到用户的后续行为和留存，是用户后续下单意愿的压舱石。 ETA在配送业务架构中也具有重要地位，是配送运单实时调度系统的关键参数。对ETA的准确预估可以提升调度系统的效率，在有限的运力中做到对运单的合理分配。在保障用户体验的同时，对ETA的准确预估也可以帮助线下运营构建有效可行的配送考核指标，保障骑手的体验和收

05

即时配送的ETA问题之亿级样本特征构造实践

ETA（Estimated time of Arrival，预计送达时间）是外卖配送场景中最重要的变量之一（如图1）。我们对ETA预估的准确度和合理度会对上亿外卖用户的订单体验造成深远影响，这关系到用户的后续行为和留存，是用户后续下单意愿的压舱石。

03

CTR 预估模型的进化之路

本文介绍了CTR预估中LR、GBDT、FTRL、DeepFM等算法，以及它们在不同场景下的应用和优缺点。

08

爱奇艺推荐系统

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

04

如何评价周志华深度森林模型，热议会否取代深度学习 DNN

【新智元导读】昨天，新智元报道了南京大学周志华教授和冯霁的论文“深度森林”，引发很多讨论。今天，新智元整理了网上一些评价。中文内容来自知乎，已经取得授权。外网内容来自 Hacker News，由新智元

05

技术干货 | 达观数据推荐系统算法实践—重排序

互联网的出现和普及给用户带来了大量的信息，满足了用户在信息时代对信息的需求，但随着网络的迅速发展而带来的网上信息量的大幅增长，使得用户在面对大量信息时无法从中获得对自己真正有用的那部分信息，对信息的使用效率反而降低了，形成了信息过载（informationoverload）的问题。达观数据解决信息过载有几种手段：一种是搜索，在用户有明确的信息需求时，将意图转换为几个简短的关键字，将关键字提交到相应的搜索引擎，搜索引擎从海量的信息库中检索出相关信息返回给客户；另一种是推荐，根据用户喜好推送个性化的结果。

04

深入浅出排序学习：写给程序员的算法系统开发实践

我们正处在一个知识爆炸的时代，伴随着信息量的剧增和人工智能的蓬勃发展，互联网公司越发具有强烈的个性化、智能化信息展示的需求。而信息展示个性化的典型应用主要包括搜索列表、推荐列表、广告展示等等。

04

深入浅出排序学习：写给程序员的算法系统开发实践

搜索、推荐和广告等这些AI主流应用背后的一个核心技术，是排序学习（Learning to Rank）。本文从系统开发工程师的角度做了非常系统通俗的解读，主要概念，连美美都看懂啦，推荐给大家。

03

深入浅出排序学习：写给程序员的算法系统开发实践

搜索、推荐和广告等这些AI主流应用背后的一个核心技术，是排序学习（Learning to Rank）。本文从系统开发工程师的角度做了非常系统通俗的解读，主要概念，连美美都看懂啦，推荐给大家。

02

深入浅出排序学习：写给程序员的算法系统开发实践

搜索、推荐和广告等这些AI主流应用背后的一个核心技术，是排序学习（Learning to Rank）。本文从系统开发工程师的角度做了非常系统通俗的解读，主要概念，推荐给大家。

01

特征工程系列：笛卡尔乘积特征构造以及遗传编程特征构造

关于作者：JunLiang，一个热爱挖掘的数据从业者，勤学好问、动手达人，期待与大家一起交流探讨机器学习相关内容~

04

知乎搜索排序模型的演进，答主必看

知乎作为一个大型的中文问答社区，有超过四千万的提问和超过两亿条回答，其中蕴含了丰富的知识、经验和见解，知乎搜索是帮助用户快速获取信息，找到答案的重要途径，随着媒介的升级，搜索结果的形式也不在局限于图文，视频解答也越来越多。

01

做Adsense的一些经验

The payment you receive per click depends on how much advertisers are paying per click to advertise using Google’s AdWords service. Advertisers can pay as little as 5 cents per click and as high as $10 or $12 in profitable niches, perhaps even more sometimes. You earn a share of that.

01

算法大佬看了流泪，为什么这么好的CTR预估总结之前没分享(下篇)

在广告、推荐系统CTR预估问题上，早期的完全规则方法被过渡到以LR为代表的机器学习方法，为了充分发挥组合特征的价值，在相当长一段时间里，业界热衷于使用LR+人工特征工程。但人工组合特征成本高昂，在不同任务上也难以复用。2010年FM因子分解方法的出现解决了人工组合特征的困境，2014年Facebook提出的GBDT+LR也给出了一种利用树模型特点构建组合特征的思路。不过随着深度学习的崛起，2015年以后，借助非线性自动组合特征能力的深度模型，开始成为业内的主流。从经典DNN到结合浅层的Wide&Deep，用于CTR预估的深度模型在近些年间百花盛开，各种交叉特征建模方法层出不穷，Attention机制也从其他研究领域引入，帮助更好的适应业务，提升模型的解释性。在这进化路线之下，核心问题离不开解决数据高维稀疏难题，自动化组合特征，模型可解释。我们梳理了近些年CTR预估问题中有代表性的模型研究/应用成果，并对部分经典模型的实现原理进行详细剖析，落成文字作为学习过程的记录。

02

分布式 PostgreSQL 集群(Citus)官方示例 - 多租户应用程序实战

如果您正在构建软件即服务 (SaaS) 应用程序，您可能已经在数据模型中内置了租赁的概念。通常，大多数信息与租户/客户/帐户相关，并且数据库表捕获这种自然关系。

02

产品赚钱背后的逻辑之广告

本文是几个月前在池老师「攻城狮之路」做过的讲座的删减版。最近整日开会和培训，白天晚上连轴转，说话说到腿软（我现在特别由衷敬佩那些能够站在讲台上讲课的老师，真心不易），于是便闹了文章荒。实在没招，便把这篇一直藏着的文章放了出来。我在我的『途客圈创业记』里提到汪华跟我们讲产品 sustainable 的两种可能：1) 产品不赚钱，但也可以以近乎免费的价格快速大量获取用户；2) 产品赚钱，平均从每用户身上赚到的钱，要大于用户获取所花费的钱。这个道理听起来简单，实践起来很困难。不管是羊毛出在羊身上，还是羊毛出在猪

07

特征工程的黑色艺术

想象一下，当今社会备受瞩目的人工智能和数据挖掘算法工程师每天大部分时间都在做什么呢？是花大量时间手推公式，还是思考各种trick对算法调参，还是一遍遍清洗数据和加工特征？实际上，大部分的数据挖掘/算法工程师在日常的工作流程中，80%以上的时间用于研究特征工程，而他们在算法设计和模型优化上分配的时间不到20%。特征工程为何如此重要，以至于数据挖掘/算法工程师甘愿把如此之多时间都花在这上面呢？

02

特征工程系列：聚合特征构造以及转换特征构造

关于作者：JunLiang，一个热爱挖掘的数据从业者，勤学好问、动手达人，期待与大家一起交流探讨机器学习相关内容~

02

特征工程系列：聚合特征构造以及转换特征构造

关于作者：JunLiang，一个热爱挖掘的数据从业者，勤学好问、动手达人，期待与大家一起交流探讨机器学习相关内容~

03

谷歌10个用户体验设计原则

1. 以人为本——专注于人们的生活、工作、梦想。Focus on people – their lives, their work, their dreams.

01

分布式 PostgreSQL 集群(Citus)，官方快速入门教程

在本教程中，我们将使用示例广告分析数据集来演示如何使用 Citus 来支持您的多租户应用程序。

02

主流CTR预估模型的演化及对比

学习和预测用户的反馈对于个性化推荐、信息检索和在线广告等领域都有着极其重要的作用。在这些领域，用户的反馈行为包括点击、收藏、购买等。本文以点击率（CTR）预估为例，介绍常用的CTR预估模型，试图找出它们之间的关联和演化规律。

04

特征工程系列：时间特征构造以及时间序列特征构造

数据和特征决定了机器学习的上限，而模型和算法只是逼近这个上限而已。由此可见，特征工程在机器学习中占有相当重要的地位。在实际应用当中，可以说特征工程是机器学习成功的关键。

04

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭