首页
学习
活动
专区
工具
TVP
发布

炼丹笔记

专栏作者
255
文章
243246
阅读量
37
订阅数
端上重排系统:提升推荐系统的实时性
获奖论文《Real-time Short Video Recommendation on Mobile Devices》针对短视频推荐场景,传统服务端部署的推荐系统在决策时机和实时特征利用方面的不足问题,通过在移动客户端部署推荐系统来实时响应用户反馈,提高推荐结果的精准度,从而提升用户体验。论文提出的方案 100% 流量部署到了快手短视频推荐生产环境,影响了日均超过 3.4 亿用户的体验,是端上智能在大规模推荐场景落地的创新实践。
炼丹笔记
2023-01-03
1.5K0
推荐系统多任务学习上分技巧
本文是一篇多任务学习的文章, 里面的设计思路非常值得借鉴,也较为符合我们的直观理解,实践中也确实带来了不错的效果。
炼丹笔记
2023-01-03
4830
腾讯提出的"最强"多任务学习(MFH)不学习下吗?
以往多任务学习(MTL)的研究都是针对小数量级任务做的,但是在推荐系统里需要对大数量的任务做multi-task的学习.举例来说,在推荐系统中会用MTL对用户多种行为进行建模,不同任务之间有着各种维度的相关性.所以这篇论文<Multi-Faceted Hierarchical Multi-Task Learning for a Large Number of Tasks with Multi-dimensional Relations>就提出了一个多视角层级MTL模型(MFH).使用层级结构可以充分挖掘出不同任务之间的关系并在工业数据集上也优于其他MTL模型.
炼丹笔记
2022-05-23
7810
是不是你的模型又线上线下不一致啦?
本文对于推荐系统中的采样评估指标进行了讨论,内容略多, 还有一些数学推导, 有兴趣的可以去阅读原文, 此处直接列出核心观点:
炼丹笔记
2022-04-11
5020
推荐系统炼丹笔记7:负样本的艺术
目前,在清洗数据构造正负样本时,由于日志的延迟上报问题,在点击事件的问题中构造样本时,往往会出现将曝光未点击数据误以为是负样本的情况,可真实的负样本真的是这样吗?
炼丹笔记
2021-12-22
3.6K0
从用户反馈的可解释性提升推荐模型
作者:十方 当我们在做推荐系统模型时,有考虑过模型推荐结果的可解释性吗?比方说推荐系统给用户推荐了item A,并在推荐结果后标明该用户最要好的朋友喜欢item A,或者和该用户有着相似兴趣(协同过滤
炼丹笔记
2021-12-20
5900
炼丹知识点:模型评估里的陷阱
在实践中,做推荐系统的很多朋友思考的问题是如何对数据进行挖掘,大多数论文致力于开发机器学习模型来更好地拟合用户行为数据。然而,用户行为数据是观察性的,而不是实验性的。这里面带来了非常多的偏差,典型的有:选择偏差、位置偏差、曝光偏差和流行度偏差等。如果不考虑固有的偏差,盲目地对数据进行拟合,会导致很多严重的问题,如线下评价与在线指标的不一致,损害用户对推荐服务的满意度和信任度等。
炼丹笔记
2021-10-26
4260
盘一盘推荐系统里值得一读的那些论文
工业中常用的推荐算法其实并不像论文中那么复杂,大多数的时候是稳定的模型、充分的特征工程和各种精妙的业务策略等。当然,如果你想,也可以做的很复杂....大部分时间读论文是在拓展思路并结合自身面临的问题去复现或者再创造,本文盘一盘在思路枯竭的时候,还有哪些论文可以值得一读。当然,本文是个人经验和阅读偏好的一些总结,没出现的也不代表不值得一读,如果有分享的论文,可以在评论区贴出来,大家一起学习哦~
炼丹笔记
2021-08-06
7010
推荐系统中的长尾物品(Tail Items)推荐问题
长尾物品(Tail Items)在推荐系统中是非常常见的,长尾的存在导致了样本的不均衡,对于热门头部物品(Head Items)的样本量多,模型学习这部分的效果越好,而长尾物品的样本量少,导致模型对该部分Item的理解不够充分,效果自然也就较差。
炼丹笔记
2021-07-16
1.7K0
当推荐系统遇上多模态Embedding
    在微信视视频号推荐算法大赛中,给出来融合了OCR、ASR、图像、文字的多模态的内容理解特征向量Feed Embedding,共512维向量。对于给定的一定数量到访过微信视频号“热门推荐”的用户,根据这些用户在视频号内的历史n天的行为数据,通过算法在测试集上预测出这些用户对于不同视频内容的互动行为(包括点赞、点击头像、收藏、转发等)的发生概率。
炼丹笔记
2021-06-15
1K0
自动化Debias框架,一键去除推荐系统所有Bias。
大多数现有的推荐debias的工作,如反向inverse propensity scoring和imputation方法,侧重于一个或两个具体的Bias,缺乏通用性。
炼丹笔记
2021-06-15
1K0
曾几何时,我们都是炼的不是丹,是特征!
对于炼丹师来说,特别是面对海量特征,还要从中挖掘出交叉特征"喂"给模型,是十分痛苦的。不得不说,人都是"懒惰"的,我们炼丹师当然希望有个厉害的深度学习模型,只需要对最原始的特征做预处理后,扔给模型,让它自己学习交叉特征。希望模型像"奶牛"吃草,挤得是"牛奶",那么我们必须保证"喂"的是草。并不是所有的交叉特征与推荐系统的最终优化目标都是相关的,盲目的"喂"特征只会带来更多的噪声和系统准确率的下降。《Detecting Beneficial Feature Interactions for Recommender Systems》这篇论文就提出了用GNN去自动检测对推荐系统有利的交叉特征。
炼丹笔记
2021-06-15
3550
她来了她来了,乘风破浪的微信视频号推荐算法
基于脱敏和采样后的数据信息,对于给定的一定数量到访过微信视频号“热门推荐”的用户, 根据这些用户在视频号内的历史n天的行为数据,通过算法在测试集上预测出这些用户对于不同视频内容的互动行为(包括点赞、点击头像、收藏、转发等)的发生概率。本次比赛以多个行为预测结果的加权uAUC值进行评分。
炼丹笔记
2021-06-15
8010
个性化推荐质量的优劣,谁说了算?
对推荐结果的评估一直都是十分重要的环节,一个推荐算法或者说排序的优劣直接体现在这些评估指标上。具体地,有三种方式,分别是产品数据层面、机器学习算法层面、用户体验层面。
炼丹笔记
2021-06-15
7900
谷歌开源下一代推荐系统模拟器-RecSim NG
推荐系统是连接用户与各种在线内容的主要接口,因此必须克服用户流行度的问题,这样可以保证公平地为他们服务。为此,在2019年我们发布了RecSim,这是一个用于创建模拟环境的可配置平台,希望它可以促进推荐系统中RL算法(解决顺序决策问题的标准ML方法)的研究。然而,随着技术的进步,解决仿真与实际应用之间的差距变得越来越重要,确保模型灵活且易于扩展,实现用户动态的概率推断,并提高计算效率。
炼丹笔记
2021-05-14
6170
入"坑"推荐系统,从Google这篇课程开始
推荐系统内容实在太丰富了,以至于刚开始学的人都无从下手,当年时晴无意中翻到谷歌这篇教程,然后就开启了入"坑"推荐系统的神奇旅程,极力推荐给大家,大家也可以推荐给想学推荐系统的童鞋们。该课程标明预估学完要用4个小时,那这篇的重点就是带大家15分钟内学完。(本篇内容较为基础,大牛们略过)
炼丹笔记
2021-05-14
8020
Learning to Rank:X-wise
LTR(Learning to Rank)学习排序已经被广泛应用到文本挖掘、搜索推荐系统的很多领域,比如IR中排序返回的相似文档,推荐系统中的候选产品召回、用户排序等,机器翻译中排序候选翻译结果等等。
炼丹笔记
2021-05-14
8040
流量为王:ABTest流量分层分桶机制
在互联网行业,无论是构建搜索推荐系统,还是智能营销等场景,都是围绕用户进行不同的实验,从各项指标上观察用户对不同交互、流程、策略、算法等反馈,进而对产品、营销策略、搜索推荐算法等进行迭代改进。
炼丹笔记
2021-05-14
3.4K0
搜推实战-终极奥秘!
P.S. 本文作为 炼丹笔记 第100篇原创文章,为了答谢这一路走来大家对炼丹笔记的关注与支持,本文文末,我们安排一次抽奖活动,送上时晴小姐姐为大家准备的青轴机械键盘1个~记得参与哦~
炼丹笔记
2021-05-14
9520
负样本修正:既然数据是模型的上限,就不要破坏这个上限
在清洗数据构造正负样本时,由于日志的延迟上报问题,在点击事件的问题中构造样本时,往往会出现将曝光未点击数据误以为是负样本的情况,可真实的负样本真的是这样吗?
炼丹笔记
2021-05-14
1.2K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档