首页
学习
活动
专区
工具
TVP
发布

2019腾讯广告算法大赛-冠军之路

正文 初次接触本赛题 鱼遇雨欲语与余:2019腾讯广告算法大赛入门-Part1(竞赛小白晋升之路)​zhuanlan.zhihu.com ?...比赛初期我也进行了我的第一次live分享,依“2019腾讯广告算法大赛”为例,介绍在进行算法中需要做那些准备。并从七部分进行分享 1. 为什么要参加数据挖掘竞赛?能带来什么? 2....初赛前的尝试 鱼遇雨欲语与余:2019腾讯广告算法大赛入门-Part2(初赛生存篇)​zhuanlan.zhihu.com ? 没到最后一刻,我们都还有机会。...初探初赛冠军 鱼遇雨欲语与余:2019腾讯广告算法大赛初赛分享-Part3(冠军篇)​zhuanlan.zhihu.com ?...初赛完整方案 鱼遇雨欲语与余:2019腾讯广告算法大赛方案分享(初赛冠军)​zhuanlan.zhihu.com ?

1K22

2019腾讯广告算法大赛方案分享(冠军)

Yu)教授的评价“冠军队伍已经在有意无意使用“广度学习”的方法” 评委讲到“这是最接近腾讯真实业务的方案” 复赛代码地址: bettenW/Tencent2019_Finals_Rank1st​github.com...如何构造新广告的特征 初赛A 总广告:1954 旧广告: 1361 新广告:593 新广告占比:30.348% 初赛B 总广告:3750 旧广告: 1382 新广告:2368 新广告占比:63.147%...因此,将广告账户ID与旧广告广告竟胜率进行组合,可以构造出广告账户ID下广告竟胜率的均值/中位数等。这样我们就可以得到了新广告广告账户ID下广告竟胜率的统计值。...第四步:最终将这些物品序列输入word2vec模型,生成最终的物品Embedding向量 具体对应代码如下: guoday/Tencent2019_Preliminary_Rank1st​github.com...这里有两个问题:guoday/Tencent2019_Preliminary_Rank1st这里有两个问题: 1.

85820
您找到你想要的搜索结果了吗?
是的
没有找到

2019腾讯广告算法大赛-复赛完整代码(冠军)

代码地址: bettenW/Tencent2019_Finals_Rank1st​github.com ?...数据地址: 链接:https://pan.baidu.com/s/1O5aOkQ_gVOuT1jkC8NFb9g 提取码:biv9 方案介绍 鱼遇雨欲语与余:2019腾讯广告算法大赛-冠军之路​zhuanlan.zhihu.com...鱼遇雨欲语与余:2019腾讯广告算法大赛方案分享(冠军)​zhuanlan.zhihu.com ? 代码解析-Part1 此部分将进行我个人部分的代码解析,结合之前分享的赛题方案,更大家进行一次复盘。...然后广告id的选取来自广告操作表,即判断‘op_type’是否存在 测试集准备(23,24号) ? 由于复赛B榜方案使用“远程监督”的方式,所以也对23号测试集进行了提取,提取方式与23号相同。...23号的数据作为训练集,虽然没有是否曝光的标签,我们退而求其次的选择了第一条非过滤的为曝光,因为竞价队列的顺序与广告基本评分有关。

77831

2019腾讯广告算法大赛方案分享(初赛冠军)

代码地址: bettenW/Tencent2019_Finals_Rank1st​github.com ?...写在前面 在本篇文章中,我将给出2019腾讯广告算法大赛的基本思路分享,将包括初赛方案分享和复赛方案分享,由于赛题的特殊性,初赛和复赛做法上的差异非常大,如果只从特征上来看,初赛和复赛的特征完全不一样。...赛题分析 腾讯效果广告采用的是GSP(Generalized Second-Price)竞价机制,广告的实际曝光取决于广告的流量覆盖大小和在竞争广告中的相对竞争力水平。...五折交叉统计代码: folds = KFold(n_splits=5, shuffle=True, random_state=2019) data['fold'] = None for fold_,(...return oof, predictions, scores, models folds = KFold(n_splits=5, shuffle=True, random_state=2019

1.7K21

【竞赛经验】2019腾讯广告算法大赛方案分享(冠军)

本文提供2019腾讯广告算法大赛冠军的代码分享。 俞士纶(Philip S. Yu)教授的评价“冠军队伍已经在有意无意使用“广度学习”的方法”,评委讲到“这是最接近腾讯真实业务的方案”。...因此,将广告账户ID与旧广告广告竟胜率进行组合,可以构造出广告账户ID下广告竟胜率的均值/中位数等。这样我们就可以得到了新广告广告账户ID下广告竟胜率的统计值。...第四步:最终将这些物品序列输入word2vec模型,生成最终的物品Embedding向量 具体对应代码如下: https://github.com/guoday/Tencent2019_Preliminary_Rank1st...本次比赛并没有用到用户属性相关数据,根据广告投放人群信息,或许可以获得更多有用的内容。 总结 本文提供2019腾讯广告算法大赛冠军的代码分享。...github: https://github.com/guoday/Tencent2019_Preliminary_Rank1st

2.1K30

2019腾讯广告算法大赛冠军方案分享(附代码)

本文提供2019腾讯广告算法大赛冠军的代码分享。 俞士纶(Philip S. Yu)教授的评价“冠军队伍已经在有意无意使用“广度学习”的方法”,评委讲到“这是最接近腾讯真实业务的方案”。...因此,将广告账户ID与旧广告广告竟胜率进行组合,可以构造出广告账户ID下广告竟胜率的均值/中位数等。这样我们就可以得到了新广告广告账户ID下广告竟胜率的统计值。...第四步:最终将这些物品序列输入word2vec模型,生成最终的物品Embedding向量 具体对应代码如下: https://github.com/guoday/Tencent2019_Preliminary_Rank1st...本次比赛并没有用到用户属性相关数据,根据广告投放人群信息,或许可以获得更多有用的内容。 总结 本文提供2019腾讯广告算法大赛冠军的代码分享。...github: https://github.com/guoday/Tencent2019_Preliminary_Rank1st

5K63

【震惊】2019腾讯广告算法大赛-冠军代码复盘解析

代码地址: bettenW/Tencent2019_Finals_Rank1st 代码解析-Part1 此部分将进行我个人部分的代码解析,结合之前分享的赛题方案,更大家进行一次复盘。...然后广告id的选取来自广告操作表,即判断‘op_type’是否存在 测试集准备(23,24号) image.png 由于复赛B榜方案使用“远程监督”的方式,所以也对23号测试集进行了提取,提取方式与23...}) btest = btest.merge(result, on=[col], how='left') 23号训练集提取【提分关键】 这里我们做了一件事情,从23号非待预估广告的请求日志和竞价队列中提取...23号的数据作为训练集,虽然没有是否曝光的标签,我们退而求其次的选择了第一条非过滤的为曝光,因为竞价队列的顺序与广告基本评分有关。

57530

2019腾讯广告算法大赛入门-Part2(初赛生存篇)

规则方法:历史平均来填充旧广告id的曝光量,新广告id曝光量用广告size、商品id等特征对应历史平均来填充。调整单调性。 规则方法:前一天的曝光量来填充旧广告id的曝光量,新广告直接填充0。...模型+规则:直接加权融合,或者模型结果填充新广告id的曝光量,规则结果填充旧广告id的曝光量。 更细致的方法需要你来挖掘!!!...我的建模思路 我的是18w左右的训练集,广告id的选取来自广告操作表,然后再构造日曝光量。...具体操作如下: 1.将广告操作表中update_time==0的出价、定向人群、投放时段信息与广告静态表merge。 2.对日志数据中的广告id构造日曝光量得到新的数据集data。...3.将data与广告静态表进行merge,并给缺失的投放时段填充-999,这里并未将投放时段展开。 4.data=data.loc[(data.投放时段!

46110

2019腾讯广告算法大赛初赛分享-Part3(冠军篇)

正文 初始建模 这里主要是训练集的构建,我的构建方式一直比较简单,主要选择广告操作表中广告创建时间有出价,定向人群和投放时段的广告id,这是第一部分的广告id,第二部分是三月份出价唯一的广告id,然后将这两部分广告...id结合起来作为最终训练集广告id,然后再构造每天的曝光量。...从去年的腾讯比赛,以及很多比赛都会使用到这个操作,简单易用,效果显著。 复赛: 对于建模的思路不同,我们构造的特征也有很大的区别。 模型选择 初赛和复赛我们都使用了nn和lgb。...规则尝试 在规则方面我们考虑更多的是旧广告,新广告完全由模型来预测。 初赛基本:前一天的曝光量来填充旧广告id的曝光量,新广告直接填充0。调整单调性。...当然,还是可以按照初赛的方法去做的,只从竞价广告队列中提取被曝光的广告,最终预测曝光量即可。

50720

【SPA大赛腾讯社交广告大赛心得分享

数据分析 大赛题目是转化率预估,这也是第一次接触这类赛题,所以遇到的问题比较多。...4.1 基本特征与特征one-hot 选取原始数据中维数较小的特征进行one-hot编码,主要包括用户的年龄、性别、婚恋状态、教育程度,广告的advertiserID、AppID、appPlatform...,广告CTR的排序特征。...4.3 特征贝叶斯平滑 在交叉得到的特征中,经观察,发现很多广告的CTR值并不准确,某些广告CTR值因为该广告总点击数较少而导致CTR较高,所以进行了贝叶斯平滑,贝叶斯平滑过程主要借鉴了博客上的思路。...4.4 离散化 在得到基本特征和处理后的特征后,主要针对统计出的广告CTR特征进行离散化,这种操作的目的是保证广告CTR值可以再预估时按照自身的重要性发挥不同的价值。

2K00

【 SPA大赛腾讯社交广告大赛初赛阶段小结

首先,我所花时间最长,也是感觉最重要的一环,是对赛题与数据要做到非常充分的了解.比赛名为腾讯社交广告算法大赛,那么我们一定要花一些时间了解一下当今媒体广告包括腾讯广点通平台的运营和收费机制,这些知识虽然看似与赛题不想管....但在我目前来看,对我特征工程和数据处理起到了潜移默化的巨大的影响.举个例子,在比赛数据中,出现了广告主-推广计划-广告-素材这样的4级树关系,应该所有同学都能从字面上理解这样的层级关系,在数据处理时进行类似树结构的方式也并不难想到...本次大赛的另一个特点便是数据带有时序性, 这给数据处理与分析造成不小的困难. 我这里主要分享一些我所做的涉及时间序列的分析工作与成果....但对本次社交广告算法大赛, 首先训练样本有时间先后关系, 而且如2中分析, 每日的user, ad都各不相同, 所以存在这样的一个隐含因素, 即若预测31日数据, 则使用越接近31日的数据训练, 则预测效果应该会越好...我这里再说一点我结合本次大赛数据, 对贝叶斯平滑做的一点点小的修改.

2.2K00

一文梳理2019腾讯广告算法大赛冠军方案

注:冠军方案源码可以从Datawhale今天发的文章《2019腾讯广告算法大赛-冠军之路》中获取,也可以在Datawhale 公众号后台回复关键词 源码 获得。 ? 背景介绍 ?...作为国内领先的大数据营销平台,全新升级的腾讯广告,以更强大的全景连接、更全链的数字智慧、更友好的人本体验等三大核心能力,构建品牌与用户的智慧连接,助力广告主高效实现商业增长。...而复杂的社交场景,多样的广告形态,以及庞大的人群数据,给实现这一目标带来了不小的挑战。为攻克这些挑战,腾讯广告也在不断地寻找更为优秀的数据挖掘方式和机器学习算法。...本次算法大赛[1]的题目是源于腾讯广告业务中一个面向广告主服务的真实业务产品 ——广告曝光预估。广告曝光预估的目的是在广告主创建新广告和修改广告设置时,为广告主提供未来的广告曝光效果参考。...比赛中使用的数据经过脱敏处理,通过本次大赛,我们旨在挑选出更为优秀的曝光预估算法以及遴选出杰出的社交广告算法达人。 ? 比赛赛题 ?

75330

2019腾讯广告算法大赛入门-Part1(竞赛小白晋升之路)

最新得分 写在前面 这试腾讯的第三届广告算法大赛,也是我第二次参加,18年很意外的拿到第十一名,虽然距离决赛只差一步,不过结果还是很令我满意的,毕竟去年的我只是初打比赛不久的小白。...参加2018年腾讯广告算法大赛决赛是一种怎样的体验? 2018腾讯广告算法大赛总结/0.772229/Rank11 分享内容不会有任何相关代码! 分享内容不会有任何相关代码!...本次竞赛将提供历史n天的曝光广告的数据(特定流量上采样), 包括对应每次曝光的流量特征(用户属性和广告位等时空信息)以及曝光广告的设置和竞争力分数;测试集是新的一批广告设置(有完全新的广告id, 也有老的广告...目标是广告日曝光值,我们可以通过日志数据统计得到,groupby(['广告id',‘请求月’,'请求日'])进行组合统计出现频次即刻。 那么问题来了,相同广告的出价一直在变,要不要加上出价进行组合呢?...看看有什么可以用的特征,主要是比较稳定,不会有太多问题的特征,所以我给出的原始训练特征有广告id,素材大小,广告行业id,商品类型,商品id,广告账户id,恰好测试集都包含这些特征,然后构造好的广告id

97811

一文梳理2019腾讯广告算法大赛冠军方案

作为国内领先的大数据营销平台,全新升级的腾讯广告,以更强大的全景连接、更全链的数字智慧、更友好的人本体验等三大核心能力,构建品牌与用户的智慧连接,助力广告主高效实现商业增长。...而复杂的社交场景,多样的广告形态,以及庞大的人群数据,给实现这一目标带来了不小的挑战。为攻克这些挑战,腾讯广告也在不断地寻找更为优秀的数据挖掘方式和机器学习算法。...本次算法大赛[1]的题目是源于腾讯广告业务中一个面向广告主服务的真实业务产品 ——广告曝光预估。 广告曝光预估的目的是在广告主创建新广告和修改广告设置时,为广告主提供未来的广告曝光效果参考。...比赛中使用的数据经过脱敏处理,通过本次大赛,我们旨在挑选出更为优秀的曝光预估算法以及遴选出杰出的社交广告算法达人。...[1] 2019腾讯广告算法大赛 https://algo.qq.com/application/home/home/index.html [2] Guiliano,数据集探索博客 https://blog.csdn.net

69920

竞赛经验 | 一文梳理2019腾讯广告算法大赛冠军方案

注:冠军方案源码可以从Datawhale今天发的文章《2019腾讯广告算法大赛-冠军之路》中获取,也可以在Datawhale 公众号后台回复关键词 源码 获得。...而复杂的社交场景,多样的广告形态,以及庞大的人群数据,给实现这一目标带来了不小的挑战。为攻克这些挑战,腾讯广告也在不断地寻找更为优秀的数据挖掘方式和机器学习算法。...本次算法大赛[1]的题目是源于腾讯广告业务中一个面向广告主服务的真实业务产品 ——广告曝光预估。广告曝光预估的目的是在广告主创建新广告和修改广告设置时,为广告主提供未来的广告曝光效果参考。...比赛中使用的数据经过脱敏处理,通过本次大赛,我们旨在挑选出更为优秀的曝光预估算法以及遴选出杰出的社交广告算法达人。...[1] 2019腾讯广告算法大赛 https://algo.qq.com/application/home/home/index.html [2] Guiliano,数据集探索博客 https://blog.csdn.net

58510

2020腾讯广告算法大赛方案分享(亚军)

赛题介绍 本届算法大赛的题目来源于一个重要且有趣的问题。众所周知,像用户年龄和性别这样的人口统计学特征是各类推荐系统的重要输入特征,其中自然也包括了广告平台。...本届大赛的题目尝试从另一个方向来验证这个假设,即以用户在广告系统中的交互行为作为输入来预测用户的人口统计学属性。...每条记录中包含了日期(从 1 到 91)、用户信息(年龄,性别),被点击的广告的信息(素材 id、广告 id、产品 id、产品类目 id、广告主id、广告主行业 id 等),以及该用户当天点击该广告的次数...3.评价指标 大赛会根据参赛者提交的结果计算预测的准确率(accuracy)。年龄预测和性别预测将分别评估准确率,两者之和将被用作参赛者的打分。测试数据集会和训练数据集一起提供给参赛者。...大赛会将测试数据集中出现的用户划分为两组,具体的划分方式对参赛者不可见。

1.4K50

2020腾讯广告算法大赛——算法小白的复盘

】数据特征化 【04】lgb模型训练 【05】test分批次预测 【06】合并和提交到COS存储桶 参考资料 写在前面 全文共计11958字,请合理使用目录(阅读助手)辅助阅读 《2020腾讯广告算法大赛...本届大赛的题目尝试从另一个方向来验证这个假设,即以用户在广告系统中的交互行为作为输入来预测用户的人口统计学属性。...【01】易观性别年龄预测chizhu大佬的冠军开源 【02】2020腾讯广告算法大赛:赛题理解与解题思路 【03】2020腾讯广告算法大赛基本思路(线上1.3+) 【04】2020腾讯广告算法大赛:如何突破分数瓶颈...【05】2020腾讯广告算法大赛:高分进阶 【06】大神干货:冠军选手分享解题思路,助你轻松突围初赛 【07】高分选手讲解:如何突破思维圈限,从NLP角度挖掘新的解题思路 【08】超值赛题分享大礼包,你的...没人逃得掉王镜泽定律(没收鹅厂广告费 ,麻烦腾讯云看到了给打笔广告费)

88011
领券