首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【SPA大赛腾讯社交广告大赛心得分享

数据分析 大赛题目是转化率预估,这也是第一次接触这类赛题,所以遇到的问题比较多。...4.1 基本特征与特征one-hot 选取原始数据中维数较小的特征进行one-hot编码,主要包括用户的年龄、性别、婚恋状态、教育程度,广告的advertiserID、AppID、appPlatform...,广告CTR的排序特征。...4.3 特征贝叶斯平滑 在交叉得到的特征中,经观察,发现很多广告的CTR值并不准确,某些广告CTR值因为该广告总点击数较少而导致CTR较高,所以进行了贝叶斯平滑,贝叶斯平滑过程主要借鉴了博客上的思路。...4.4 离散化 在得到基本特征和处理后的特征后,主要针对统计出的广告CTR特征进行离散化,这种操作的目的是保证广告CTR值可以再预估时按照自身的重要性发挥不同的价值。

2K00

【 SPA大赛腾讯社交广告大赛初赛阶段小结

首先,我所花时间最长,也是感觉最重要的一环,是对赛题与数据要做到非常充分的了解.比赛名为腾讯社交广告算法大赛,那么我们一定要花一些时间了解一下当今媒体广告包括腾讯广点通平台的运营和收费机制,这些知识虽然看似与赛题不想管....但在我目前来看,对我特征工程和数据处理起到了潜移默化的巨大的影响.举个例子,在比赛数据中,出现了广告主-推广计划-广告-素材这样的4级树关系,应该所有同学都能从字面上理解这样的层级关系,在数据处理时进行类似树结构的方式也并不难想到...本次大赛的另一个特点便是数据带有时序性, 这给数据处理与分析造成不小的困难. 我这里主要分享一些我所做的涉及时间序列的分析工作与成果....但对本次社交广告算法大赛, 首先训练样本有时间先后关系, 而且如2中分析, 每日的user, ad都各不相同, 所以存在这样的一个隐含因素, 即若预测31日数据, 则使用越接近31日的数据训练, 则预测效果应该会越好...我这里再说一点我结合本次大赛数据, 对贝叶斯平滑做的一点点小的修改.

2.2K00
您找到你想要的搜索结果了吗?
是的
没有找到

2019腾讯广告算法大赛-冠军之路

写在前面 历时三个月腾讯广告算法大赛已经告一段落,在前两届成功经验的基础上,今年大赛在赛题专业性和赛事体验上都有了更大的提升,进而吸引了更多海内外优秀选手参加,最终报名人数高达10,571...正文 初次接触本赛题 鱼遇雨欲语与余:2019腾讯广告算法大赛入门-Part1(竞赛小白晋升之路)​zhuanlan.zhihu.com ?...初赛前的尝试 鱼遇雨欲语与余:2019腾讯广告算法大赛入门-Part2(初赛生存篇)​zhuanlan.zhihu.com ? 没到最后一刻,我们都还有机会。...初探初赛冠军 鱼遇雨欲语与余:2019腾讯广告算法大赛初赛分享-Part3(冠军篇)​zhuanlan.zhihu.com ?...初赛完整方案 鱼遇雨欲语与余:2019腾讯广告算法大赛方案分享(初赛冠军)​zhuanlan.zhihu.com ?

1K22

2019腾讯广告算法大赛方案分享(冠军)

Yu)教授的评价“冠军队伍已经在有意无意使用“广度学习”的方法” 评委讲到“这是最接近腾讯真实业务的方案” 复赛代码地址: bettenW/Tencent2019_Finals_Rank1st​github.com...赛题理解 数据 历史日志数据:广告请求时间、用户id、广告位id、竞价广告信息等 用户信息数据:包含用户id、年龄、性别、地域、行为兴趣等 广 告 数 据:广告操作信息、广告静态信息 2....如何构造新广告的特征 初赛A 总广告:1954 旧广告: 1361 新广告:593 新广告占比:30.348% 初赛B 总广告:3750 旧广告: 1382 新广告:2368 新广告占比:63.147%...上面是对初赛新旧广告的统计,当然复赛也存在大量的新广告,复赛B榜新旧广告基本55开。...因此,将广告账户ID与旧广告广告竟胜率进行组合,可以构造出广告账户ID下广告竟胜率的均值/中位数等。这样我们就可以得到了新广告广告账户ID下广告竟胜率的统计值。

86620

2020腾讯广告算法大赛方案分享(亚军)

赛题介绍 本届算法大赛的题目来源于一个重要且有趣的问题。众所周知,像用户年龄和性别这样的人口统计学特征是各类推荐系统的重要输入特征,其中自然也包括了广告平台。...本届大赛的题目尝试从另一个方向来验证这个假设,即以用户在广告系统中的交互行为作为输入来预测用户的人口统计学属性。...每条记录中包含了日期(从 1 到 91)、用户信息(年龄,性别),被点击的广告的信息(素材 id、广告 id、产品 id、产品类目 id、广告主id、广告主行业 id 等),以及该用户当天点击该广告的次数...3.评价指标 大赛会根据参赛者提交的结果计算预测的准确率(accuracy)。年龄预测和性别预测将分别评估准确率,两者之和将被用作参赛者的打分。测试数据集会和训练数据集一起提供给参赛者。...大赛会将测试数据集中出现的用户划分为两组,具体的划分方式对参赛者不可见。

1.4K50

2019腾讯广告算法大赛-复赛完整代码(冠军)

数据地址: 链接:https://pan.baidu.com/s/1O5aOkQ_gVOuT1jkC8NFb9g 提取码:biv9 方案介绍 鱼遇雨欲语与余:2019腾讯广告算法大赛-冠军之路​zhuanlan.zhihu.com...鱼遇雨欲语与余:2019腾讯广告算法大赛方案分享(冠军)​zhuanlan.zhihu.com ? 代码解析-Part1 此部分将进行我个人部分的代码解析,结合之前分享的赛题方案,更大家进行一次复盘。...然后广告id的选取来自广告操作表,即判断‘op_type’是否存在 测试集准备(23,24号) ? 由于复赛B榜方案使用“远程监督”的方式,所以也对23号测试集进行了提取,提取方式与23号相同。...}) btest = btest.merge(result, on=[col], how='left') 23号训练集提取【提分关键】 这里我们做了一件事情,从23号非待预估广告的请求日志和竞价队列中提取...23号的数据作为训练集,虽然没有是否曝光的标签,我们退而求其次的选择了第一条非过滤的为曝光,因为竞价队列的顺序与广告基本评分有关。

78531

2019腾讯广告算法大赛方案分享(初赛冠军)

写在前面 在本篇文章中,我将给出2019腾讯广告算法大赛的基本思路分享,将包括初赛方案分享和复赛方案分享,由于赛题的特殊性,初赛和复赛做法上的差异非常大,如果只从特征上来看,初赛和复赛的特征完全不一样。...赛题分析 腾讯效果广告采用的是GSP(Generalized Second-Price)竞价机制,广告的实际曝光取决于广告的流量覆盖大小和在竞争广告中的相对竞争力水平。...其中广告的流量覆盖取决于广告的人群定向(匹配对应特征的用户数量)、广告素材尺寸(匹配的广告位)以及投放时段、预算等设置项。...本次竞赛将提供历史n天的曝光广告的数据(特定流量上采样),包括对应每次曝光的流量特征(用户属性和广告位等时空信息)以及曝光广告的设置和竞争力分数;测试集是新的一批广告设置(有完全新的广告id,也有老的广告...初赛A 总广告:1954 旧广告: 1361 新广告:593 新广告占比:30.348% 初赛B 总广告:3750 旧广告: 1382 新广告:2368 新广告占比:63.147% 3)对于最后提交结果

1.7K21

2020腾讯广告算法大赛——算法小白的复盘

】数据特征化 【04】lgb模型训练 【05】test分批次预测 【06】合并和提交到COS存储桶 参考资料 写在前面 全文共计11958字,请合理使用目录(阅读助手)辅助阅读 《2020腾讯广告算法大赛...本届大赛的题目尝试从另一个方向来验证这个假设,即以用户在广告系统中的交互行为作为输入来预测用户的人口统计学属性。...【01】易观性别年龄预测chizhu大佬的冠军开源 【02】2020腾讯广告算法大赛:赛题理解与解题思路 【03】2020腾讯广告算法大赛基本思路(线上1.3+) 【04】2020腾讯广告算法大赛:如何突破分数瓶颈...【05】2020腾讯广告算法大赛:高分进阶 【06】大神干货:冠军选手分享解题思路,助你轻松突围初赛 【07】高分选手讲解:如何突破思维圈限,从NLP角度挖掘新的解题思路 【08】超值赛题分享大礼包,你的...没人逃得掉王镜泽定律(没收鹅厂广告费 ,麻烦腾讯云看到了给打笔广告费)

89311

2018腾讯广告算法大赛总结0.772229Rank11

Lookalike 技术,设计基于种子用户画像和关系链寻找相似人群,即根据种子人群的共有属性进行自动化扩展,以扩大潜在用户覆盖面,提升广告效果。...具体来讲,种子包里包含有广告主提交的一批已知种子用户,可以当作机器学习问题中的正样本。广告平台中有海量的非种子用户,也有大量的广告投放历史数据,可以帮助生成负样本。...由于Lookalike相似人群扩展和广告CTR有些类似,所以我们沿用了很多阿里妈妈搜索广告转化预测的特征和模型。...1.1评估指标 对于扩展后的相似用户,如果在广告投放上有相关的效果行为(点击或者转化), 则认为是正例;如果不产生效果行为,则认为是负例。...每个待评估的种子包会提供如下信息:种子包对应的广告aid及其特征,以及对 应的候选用户集合(uid及其特征)。

1.3K20

【 SPA 大赛腾讯社交广告转化率预估初探

相比传统广告,互联网广告最大的优势之一:效果可测量,即用户看广告以及看过广告之后的行为可以被记录下来,如果再按照一定的规则,对这些数据进行归因,这就意味着,广告主在多个渠道推广之后,可以清晰的知道各个渠道的推广效果和获得用户量...用户看广告相关的数据;可以理解为线上的数据,包括:看广告、点击广告等相关信息。 用户看过广告之后,实际发生转化的数据;包括线上线下,但都是存在广告主系统里。...随着互联网广告市场的发展,转化数据越来越成为广告主与代理商、广告平台等角色之间进行效果评估和核算的主要方式之一;另一方面,广告主完成与广告平台的转化数据对接,需要一定的技术实力。...对于广告平台来说,就需要设计良好的机制,来规避广告主作弊的动机。...要处理腾讯这种海量数据,算法的并行化必须是标配, FTRL 的并行化可以参考 ParallelSGD 的思路,也可以考虑 Hogwild!的思想;从数据并行,模型并行,或数据+模型并行的角度考虑。

1.9K00

【竞赛经验】2019腾讯广告算法大赛方案分享(冠军)

本文提供2019年腾讯广告算法大赛冠军的代码分享。 俞士纶(Philip S. Yu)教授的评价“冠军队伍已经在有意无意使用“广度学习”的方法”,评委讲到“这是最接近腾讯真实业务的方案”。...数 据:广告操作信息、广告静态信息 2....如何构造新广告的特征 初赛A 总广告:1954 旧广告: 1361 新广告:593 新广告占比:30.348% 初赛B 总广告:3750 旧广告: 1382 新广告:2368 新广告占比:63.147%...因此,将广告账户ID与旧广告广告竟胜率进行组合,可以构造出广告账户ID下广告竟胜率的均值/中位数等。这样我们就可以得到了新广告广告账户ID下广告竟胜率的统计值。...本次比赛并没有用到用户属性相关数据,根据广告投放人群信息,或许可以获得更多有用的内容。 总结 本文提供2019年腾讯广告算法大赛冠军的代码分享。

2.1K30

【 SPA 大赛 】从点击率预估的视角看腾讯社交广告算法大赛

作者:汤斌 大赛简介 腾讯社交广告算法大赛广告领域常见的转化率预估问题作为出题思路,从用户历史一个月的行为数据中采样竞赛数据,数据规模达几十GB。比赛题目足够诚意的同时,资金投入也显得诚意满满。...笔者在腾讯主要从事广告与上下文画像,点击率预估相关的工作。在大多数人眼中,点击率预估与转化率预估除了优化目标上的不同,其他差异并不明显。两者的解题套路以及使用的工具也颇为相似。但事实真的是这样吗?...而转化率预估的是用户跳转到广告主推广页面的转化行为,数据采集依赖于广告主的配合。即使在广告主配合的情况下,也存在转化数据链路的工程稳定性问题。...转化率预估在效果数据采集上的困难是广告系统采用CPA[1]计费的一个主要难点。转化数据采集的能力,是腾讯社交效果广告的一大优势,在APP类广告中这种优势体现得尤为突出。...[1] CPA计费:按广告的实际转化效果扣费 总结 笔者从点击率预估的视角对腾讯社交广告大数据竞赛的赛题做了点评,主要对比了广告点击率预估与转化率预估的异同点,突出比较了两者的差异性。

1.7K00

2021腾讯广告算法大赛初赛开启

以下文章来源于腾讯广告算法大赛 ,作者腾讯广告算法大赛 4月30日,2021腾讯广告算法大赛初赛正式拉开帷幕,各路技术大咖汇聚一堂,开始算法比拼!...随着5G时代的来临,视频广告出现爆发式增长,本届腾讯广告算法大赛顺应时代发展,聚焦营销市场对视频广告内容深度理解的迫切诉求,首次开设了“视频广告秒级语义解析”和“多模态视频广告标签”两大赛道,让比赛在富有挑战性的同时...同时,2021腾讯广告算法大赛大赛中会给予所有参赛选手一系列官方的平台支持。...为了帮助参赛者们熟悉初赛阶段的赛程规划及规则,我们整理了本次腾讯广告算法大赛初赛的安排和注意事项,让各位参赛者可以合理规划时间,以最佳状态备战赛事。...究竟谁能笑到最后,勇夺2021腾讯广告算法大赛的桂冠?就让我们拭目以待吧! 了解更多 TI-ONE 平台资讯,请关注【腾讯云AI平台】(ID:TI-ML-AI)

50320

2020腾讯广告算法大赛圆满落幕

以下文章来源于腾讯广告算法大赛 ,作者腾讯广告算法大赛 8月3日,2020腾讯广告算法大赛决赛在深圳腾讯滨海大厦顺利举行。十强战队集结腾讯,花式解密“逆算”难题。...2020腾讯广告算法大赛决赛 最终,由王贺、郭达雅、梁少强组成的“DYG”战队凭借在复赛阶段的优异成绩与答辩时的出色表现,从来自10座城市的十支战队中脱颖而出,摘得2020腾讯广告算法大赛的桂冠,成功将...腾讯广告副总裁蒋杰在决赛开场致辞时说道,“这四年来,腾讯广告算法大赛坚持从实践角度出发,贯彻技术落地,提供富有研究价值和应用价值的优质议题,让大家在竞技与交流中不断推动产学研的交流与融合,这也是腾讯广告举办算法大赛的初衷之一...四年来,腾讯广告算法大赛在实践价值与技术挑战的融合程度上愈加紧密,始终走在产研融合的第一线。随着赛事的规模与影响力不断攀升,腾讯广告算法大赛已经成为全球顶级、最受关注的算法赛事之一。...腾讯广告相信,以AI技术驱动的营销革命就在眼前,腾讯广告算法大赛将始终是广大技术人一展身手的绝佳舞台,2021年,算法争锋等你来战! 别着急走开!2020腾讯广告算法大赛特在此送上特别福利。

78960

一文梳理2017腾讯广告算法大赛决赛方案

写在前面 时隔两年,这篇决赛方案梳理悄然登场,主要针对前十名的方案进行学习,17的腾讯赛算法是比较早的ctr比赛,很多方法都值得借鉴,同时也不乏有经典的操作。...第一届腾讯社交广告高校算法大赛以“移动App广告转化率预估“为主题,首次开放腾讯在社交和数字广告领域的“实战类”数据,以高度模拟真实业务的赛题方式呈现,并直指数字广告中的核心关键问题:转化预估,面向高校学生征集最智慧的算法解决方案...赛题描述 计算广告是互联网最重要的商业模式之一,广告投放效果通常通过曝光、点击和转化各环节来衡量,大多数广告系统受广告效果数据回流的限制只能通过曝光或点击作为投放效果的衡量标准开展优化。...腾讯社交广告(Tencent Social Ads)发挥特有的用户识别和转化跟踪数据能力,帮助广告主跟踪广告投放后的转化效果,基于广告转化数据训练转化率预估模型(pCVR,Predicted Conversion...业界对于广告点击转化(CTR)的研究一直比较重视,而且目前应用相对成熟,腾讯本次比赛是对广告转化率(CVR)进行预估算是独出心裁,该次比赛无论是在学术研究还是业界应用都有较高的研究价值。

1K40

2019腾讯广告算法大赛冠军方案分享(附代码)

本文提供2019年腾讯广告算法大赛冠军的代码分享。 俞士纶(Philip S. Yu)教授的评价“冠军队伍已经在有意无意使用“广度学习”的方法”,评委讲到“这是最接近腾讯真实业务的方案”。...数 据:广告操作信息、广告静态信息 2....如何构造新广告的特征 初赛A 总广告:1954 旧广告: 1361 新广告:593 新广告占比:30.348% 初赛B 总广告:3750 旧广告: 1382 新广告:2368 新广告占比:63.147%...因此,将广告账户ID与旧广告广告竟胜率进行组合,可以构造出广告账户ID下广告竟胜率的均值/中位数等。这样我们就可以得到了新广告广告账户ID下广告竟胜率的统计值。...本次比赛并没有用到用户属性相关数据,根据广告投放人群信息,或许可以获得更多有用的内容。 总结 本文提供2019年腾讯广告算法大赛冠军的代码分享。

5K63

2020腾讯广告算法大赛:赛题理解与解题思路

写在前面 期待已久的2020腾讯广告算法大赛终于开始了,本届赛题“广告受众基础属性预估”。本文将给出解题思路,以及最完备的竞赛资料,助力各位取得优异成绩!!!...报名链接: 2020腾讯广告算法大赛​algo.qq.com 赛题数据刚刚发出,小编作为数据竞赛圈狂热爱好者当然也不会错过这次学习的机会啦,解读数据成为问题建模的第一步,本文将从赛题理解、特征提取和建模思路进行一一分析...初期需要去理解每个变量的含义,比如creative_id广告素材可能由文案、图片和视频组成,一个广告包含多个广告素材,因此广告素材生成的流程也需要加以了解。...creative_id: 用户点击的广告素材的 id,采用类似于 user_id 的方式生成。 lick_times: 当天该用户点击该广告素材的次数。...ad.csv: creative_id:广告素材id ad_id: 该素材所归属的广告的 id,采用类似于 user_id 的方式生成。每个广告可能包含多个可展示的素材。

93910
领券