首页
学习
活动
专区
工具
TVP
发布

小小挖掘机

专栏作者
516
文章
861987
阅读量
237
订阅数
推荐系统遇上深度学习(一四零)-[美团]基于“采样”的超长行为序列建模方法SDIM
今天给大家带来的是美团在CIKM2022上中稿的论文,重点关注于CTR预估中的超长用户行为序列建模。与SIM、ETA这类基于“检索”的建模范式不同,论文提出了一种简单而且有效的基于“采样”的建模范式。基于采样多个hash function和SimHash,弥补了基于“检索”的建模范式中信息缺失以及效果和效率难以平衡的缺点,极大降低计算复杂度的同时实现了在超长行为序列下类似target-attention的建模效果,一起来看一下。
石晓文
2022-12-30
1.1K0
推荐系统遇上深度学习(一三零)-[阿里]电商搜索CTR预估中页面级反馈建模
今天来介绍一篇阿里在WSDM2022上中稿的文章,与之前的用户兴趣建模的论文引入单点用户行为序列不同,本文引入了页面级的用户行为序列,充分建模用户反馈的上下文信息和页面兴趣演化过程。出发点较新颖,一起来研究一下。
石晓文
2022-04-06
9680
强化学习推荐系统的模型结构与特点总结
提到强化学习,似乎总给人一种难以训练且难以落地的感觉。但是听大佬说,企业里强化学习推荐系统(RLRS)落地的例子其实已经有不少,不过一般都没有公开细节。现有公开且知名的RLRS技术分享有:
石晓文
2021-03-24
1K0
怎样将Embedding融入传统机器学习框架?
LR本身是一个经典的CTR模型,广泛应用于推荐/广告系统。输入的特征大多数是离散型/组合型。那么对于Embedding技术,如何在不使用深度学习模型的情况下(假设就是不能用DNN),融入到LR框架中呢?让我们来看看清华大学的博士石塔西大佬是如何解答的。
石晓文
2020-12-23
1.7K0
推荐系统遇上深度学习(一零四)-[阿里]CTR预估中细粒度特征学习的多交互注意力网络
今天给大家介绍的是阿里在WSDM21上发表的一篇文章,题目为《Multi-Interactive A ention Network for Fine-grained Feature Learning in CTR Prediction》,通过多交互注意力网络,建模了用户维度,上下文维度,行为序列维度等细粒度特征与候选物品的相关性,一起来看下。
石晓文
2020-12-22
1.4K0
CTR和推荐算法有什么本质区别?
CTR预估起源于计算广告,因为关系到真金白银的定价问题,因此要求预估出来的CTR必须“绝对准确”。这是因为,假如给一个用户准备了A/B/C三个广告,那么无论预测CTR是0.9、0.8、0.6,还是0.5、0.4、0.3都不影响三个广告的展现顺序,但是向客户的收费却有天壤之别。
石晓文
2020-12-22
2.1K0
3W字长文带你轻松入门视觉Transformer
Transformer整个网络结构完全由Attention机制组成,其出色的性能在多个任务上都取得了非常好的效果。本文从Transformer的结构出发,结合视觉中的成果进行了分析,能够帮助初学者们快速入门。
石晓文
2020-12-08
9300
比监督学习做的更好:半监督学习
监督学习是人工智能领域的第一种学习类型。从它的概念开始,无数的算法,从简单的逻辑回归到大规模的神经网络,都已经被研究用来提高精确度和预测能力。
石晓文
2020-12-08
1.2K0
3个Tricks帮你提升你Debug Pytorch的效率
每一个深度学习项目都是不同的。不管你有多少经验,你总会遇到新的挑战和意想不到的行为。你在项目中运用的技巧和思维方式将决定你多快发现并解决这些阻碍成功的障碍。
石晓文
2020-11-09
1.1K0
DCN-M:Google提出改进版DCN,用于大规模排序系统的特征交叉学习(附代码)
“ 本文结合DeepCTR-Torch中的代码实现,介绍了DCN的改进版——DCN-M。该模型能更有效地学习特征交叉,并通过低秩矩阵分解对参数矩阵进行降维,降低计算成本。受MOE结构启发,作者还在多个子空间中建模特征交叉。实验表明,传统的基于ReLU的神经网络在学习高阶特征交叉时效率较低;DCN-M能够在保证效率较高的同时,取得优于SOTA方法的效果。”
石晓文
2020-11-09
3.3K0
真正想做算法的,不要害怕内卷
也不知道从啥时候开始,内卷这个词就火起来了。具体到数据和算法等技术岗位方面,内卷可以理解为一年比一年高的入行门槛以及愈发激烈的同行竞争。比如说前段时间知乎上的一个“如何看待2021年秋招算法岗灰飞烟灭?”问题,就引发了将近500万人的围观。
石晓文
2020-11-09
7080
推荐系统中的排序学习
“ 本文首先介绍排序学习的三种主要类别,然后详细介绍推荐领域最常用的两种高层排序学习算法框架:BPR和LambdaMART。因为排序学习的算法和实践大都来源于信息检索,一些理论也必须从信息检索的领域说起,所以本文也会涉及一些的信息检索、搜索方面的理论知识,但重点依然会放在推荐领域排序学习的应用思路。”
石晓文
2020-10-09
2.4K0
无问西东 | 计算机科班小硕的秋招之路
背景为211本硕&计算机科班,无论文无实习,去年趁着暑假时间做了两个竞赛,名次top20这样子,研究生主要是做城市计算的,涉及到机器学习、深度学习、强化学习和图方面的一些算法和内容,导师不怎么管,所以这些理论知识基本都是自学的,其中强化学习是因为疫情在家,觉得开学要找工作了,只靠机器学习和深度学习估计没啥竞争力,所以硬着头皮把强化学习的理论给啃了下来,希望能添加点亮点;剑指offer在家刷了一遍,6月份开学开始刷leetcode,大概刷了150道左右吧,刷的题不是很多,所以后面面试考算法题不是特别顺利,笔试难点的公司基本挂掉。
石晓文
2020-09-25
9640
SIGIR20最佳论文:通往公平、公正的Learning to Rank!
SIGIR2020 的 best paper 终于出炉,这次获奖论文是 Controlling Fairness and Bias in Dynamic Learning-to-Rank,这是一篇 排序学习(Learning to Rank,LTR) 的论文。
石晓文
2020-09-15
1.1K0
乘风破浪 | 「字节跳动+百度」推荐岗面经请查收
背景为C9计算机科班,研究生期间方向主要为CV方向,在这方面做过很多有意思的工作。目前发表了两篇顶刊顶会一作论文(优化算法、模型压缩和OCR等)以及多篇其它非一作论文,校招阶段转到了推荐这个领域,之前和导师一起创业,创业主要做的也是cv相关的,本来是打算读博的,不过后来因为各种原因重新找工作了,个人的优势可能在于一个是论文比较多,然后也有两个还不错的CV类比赛成绩(比如CVPR 2018细粒度分类比赛)。
石晓文
2020-09-15
5650
字节最新复杂召回模型,提出深度检索DR框架解决超大规模推荐系统中的匹配问题
导读:今天分享一下ByteDance最新公开的一篇关于复杂深度召回模型的论文“深度检索”,使用EM算法学习图路径模型,取得了与暴力算法相当的效果,推荐工业界实战干货论文,值得细读。
石晓文
2020-09-15
2.4K0
秋招系列 | 推荐岗史上最强面经来袭(上)
背景为985本硕&计算机科班,研究生期间方向主要为推荐算法,投递的方向主要为推荐/广告/机器学习。目前国内已从A收割到Z。本科做工程相关,研究生期间转算法,发表过CCF A类论文一作1篇,有过大厂实习经验、开源项目和机器学习比赛“划水“经历。
石晓文
2020-09-15
1.1K0
推荐系统架构治理
导读:在数字化革命和AI赋能的大背景下,推荐场景逻辑越来越复杂,推荐细分场景越来越丰富,对业务迭代和效果优化的效率有了更高的要求。推荐系统业务和技术在传统架构支撑下自然堆砌,变得越来越臃肿,开发维护困难,推荐系统在应用架构上正面临新的挑战。本文就第四范式在智能推荐系统架构方面的探索实践,聊一聊在应用架构治理方面提升推荐服务开发维护效率,增强系统灵活性和扩展性的新探索。重点探讨在开发推荐系统乃至智能系统领域时遇到的问题,解决方法及未来的发展趋势。
石晓文
2020-09-15
9520
KDD 2020 | 多任务保量优化算法在优酷视频场景的实践
导读:今天分享一下阿里优酷视频在KDD 2020上的一篇关于新热视频保量分发上的实践,建立了新热内容曝光敏感模型并给出了一种多目标优化保量的算法,推荐工业界实战干货论文,值得细读。
石晓文
2020-09-15
2.1K0
不要再对类别变量进行独热编码了
独热编码,也称为dummy变量,是一种将分类变量转换为若干二进制列的方法,其中1表示属于该类别的行。
石晓文
2020-09-07
2K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档