今天阅读的是阿里 2018 年的论文《Deep Interest Evolution Network for Click-Through Rate Prediction》,文章中提出的 DIEN 是之前我们介绍的 DIN 的改进版。
在之前的文章中,我们将2022年已公布的AI顶会(含SIGIR/KDD/WSDM/ICDE/CIKM、RecSys/WWW、ICML/ICLR/ACL/NAACL/AAAI/IJCAI等) 中推荐系统相关论文梳理了一遍,具体可以参考公众号历史文章。
导读:58同城作为分类信息网站,服务覆盖多个领域,如房屋租售、招聘求职、二手买卖等等,不同的业务有不同的特点,这使得多业务融合推荐成为一大挑战。如何准确挖掘用户的需求?如何平衡各业务之间的流量分配?如何增加多样性提升用户体验?这些问题将在本次分享中解答。
用户在使用一个APP或者浏览网页的过程中,都是由一些行为构成的,以资讯类为例,通常对一个帖子感兴趣,对于感兴趣的帖子,通常会点击进入查看,或者点击收藏或者对其进行评论,这一系列行为的背后都体现了用户的兴趣,而对用户行为过的帖子的序列的挖掘,能够对用户兴趣的表征。
用户画像一般是指将用户信息标签化的过程,在分析用户属性这种静态维度时,通过平台自身的合理引导便能获取到精准的用户信息,那么关于”用户兴趣“这种可变动态的属性该怎么去构建用户画像呢?这个新浪微博的案例或
机器之心专栏 机器之心编辑部 来自快手和武汉大学的研究者通过结合多兴趣学习和多层级图卷积聚合提出了一种多粒度神经模型,显著增强了精确学习用户复杂行为的能力,对用户不同层级下多种兴趣的细粒度建模为序列推荐领域的前沿研究拓宽了方向。该研究已被今年的 SIGIR 会议录取为长论文。 随着大众获取信息方式的移动化和碎片化,短视频分享平台(如快手、抖音)逐渐成为人们生活中获取信息和休闲娱乐的重要渠道。不断突破记录的 DAU 一方面伴随着巨大的商业价值,另一方面也给千人千面的推荐算法带来巨大的挑战。 在快手单列的流式推
作者:@fengyoung 于2015小光棍节 原文:http://www.wbrecom.com/?p=588 社交媒体(Social Media)相对于传统互联网媒体的最大区别是通过建立人与人之间
本文是针对触发诱导推荐(Trigger-Induced Recommendation,TIR)提出的推荐算法,所谓TIR就是比如在大促活动会场点击某个item后会跳转到承接页,承接页里会有相关的商品,这些商品就是通过点击前面的item触发的,这个item有点像一个“钩子”。例子如下图所示
TLDR: 本文针对移动互联网业务中用户在app中既使用搜索又使用推荐服务的场景,提出了一种搜索增强的序列推荐框架SESRec。该框架通过将用户的搜索与推荐兴趣相结合,解耦了用户搜索和推荐行为中相似和不相似兴趣之间的联系。另外,由于用户反馈中缺乏兴趣之间相似度的标签,我们利用了对比学习自监督兴趣的解耦。实验验证了所提出框架的有效性。
花了几天看了些做社交的好友推荐,现在很多App都有社交场景,本身就是做用户的场景,所以以后肯定要在这块有一些应用。像早期的论坛类的更偏重资讯类的信息,后来像优酷土豆这又是做视频类,网易云音乐做音乐类。豆瓣相对来说还比较全一些,有包含资讯、音乐电台等这些。也用了一些其他做社交场景的App,包括像脉脉、钉钉这些。感觉不是太好,具体原因就是都不是什么认识的人,活跃度也不高。很多App基本上就是属于少数意见领袖,这些人有大量的粉丝。而还有一帮大量用户,他们粉丝不多活跃也不高。本质上来说,还是没有找到他们感兴趣的内容。就跟昨天一样,突然腾讯视频给我推了下2007出的《远古入侵》,这推的太给力了!一部科幻、时空穿越、冒险题材的英剧就应该推给我这样tag的用户。
雷军曾接受采访表示小米的核心战略是连接一切,已投资10亿美金启动内容投资并招募老将陈彤操盘。无独有偶,马化腾则表示腾讯未来最重要的是做好连接器和内容。坐拥微信和手Q的腾讯是最大的移动互联网公司,小米则是一家潜力无限的移动互联网公司。在这两个最移动化的公司,内容都与“连接”并列在一起成为两大核心战略,并非巧合。 注意力时代内容为王 在移动互联网各类基础设施跑马圈地完成后,不论是创业者还是大公司都转向三个新方向:硬件、O2O,还有内容。硬件是手机的衍伸、O2O是电商的实体化,内容则是互联网一直存在的庞大产业,因
用户-商品交互的时间顺序可以揭示出推荐系统中用户行为随时间演进的序列性特征。用户与之交互的商品可能受到用户曾经接触的商品的影响。但是,用户和商品数量的大量增加,使得序列推荐系统仍然面临很多重要问题:(1)对短时用户兴趣建模的困难;(2)捕捉用户长期兴趣的困难;(3)对商品共现模式的建模效率较低。为了应对这些挑战,本文提出了一个记忆增强的图神经网络(memory augmented graph neural network, MA-GNN),以捕捉用户的长期和短期兴趣。
MRIF: Multi-resolution Interest Fusion for Recommendation(SIGIR2020)
MiNet: Mixed Interest Network for Cross-Domain Click-Through Rate Prediction(CIKM20)
近年来很多序列化推荐的方法都是通过把用户历史行为序列转化为一个总的向量化表达,来给用户做下一个item推荐。然而,通过经验性的分析,我们就会发现用户序列行为中包含多种多样完全不同含义的item,这个表示用户的向量受历史行为的影响非常大,因此无法推荐出用户历史行为中类别占比较小的item。所以应该用不同的embedding去编码用户当前的意图,这篇论文《Sparse-Interest Network for Sequential Recommendation》提出了SINE解决序列化推荐的问题,炼丹笔记前面已经介绍了大部分阿里的序列化推荐算法,所以废话不多说,直接介绍SINE。
移动互联网的兴起让我们能够更加简单和方便地获取信息,但更多的选择也带来更多的困扰——面对这些层出不穷的信息和服务带来的困扰,个性化推荐技术迅速崛起。达观数据在这方面做了很多提升推荐质量、推荐效率和系统可靠性的工作,并为企业客户提供了包括私有化部署、SaaS等灵活的接入方式。目前,达观数据个性化推荐引擎已经服务几百家企业,对改善用户体验、增加用户停留时长和粘性、提高用户转化都有显著的效果。 1 互联网越发展,越需要个性化推荐 随着互联网时代的到来,新闻资讯行业中,有三大核心特点日渐突出。 一是资讯更新极
如今,随着年轻人的“口味”愈发刁钻,能够真正“满足”年轻人的产品也愈发稀少,想要其“忠诚”就变得极其困难。年轻人偏好“兴趣消费”的消费习惯,也让兴趣社区逐渐变成了众多互联网玩家不约而同地发力方向。
用户兴趣是推荐系统中非常重要的trigger,在召回阶段,通过召回与用户兴趣相匹配的item,在排序阶段,用户兴趣作为很重要的一个特征维度,与用户兴趣越相似的item将会被排到越靠前的位置。因此,在推荐系统中,对于用户兴趣的建模显得尤为重要。在目前为止,通常采用的方法是对用户的历史行为挖掘,实现对用户兴趣的建模。
在 CTR 预估中,从用户的行为序列中捕捉用户动态变化的兴趣一直是一个热门课题。然而现在大部分研究都集中在 Sequence 中 而不是 Session。阿里的同学观察到,每个 Session 中的用户行为都是高度同构的,而 Session 之间都是异构的。
Deep Multi-Interest Network for Click-through Rate Prediction(CIKM 2020)
截至2014年6月,每天有超过3亿用户在使用手机社交软件。对比PC互联网时代,当年百度贴吧一个“贾君鹏你妈喊你回家吃饭”的帖子一周回帖30万引起媒体注意,被炒作起来。在兴趣部落里,天天都有评论超过10万的话题,火爆程度远胜当年的百度贴吧。在关系链社交大局已定的同时,兴趣社交成为新的蓝海,充满了机遇与挑战。腾讯汇客厅秉承“轻分享,讲干货”的理念,邀请到QQ兴趣部落的负责人Thomas王剑伟与大家分享有关兴趣社交的想法和理念。 以下为分享干货。如时间有限,可以只读以下核心观点和橙色部分,获得概要。 1. QQ用
导读:本次带给大家分享是阿里妈妈在2018年做的模型上的创新——深度兴趣演化网络(Deep Interest Evolution Network),分享将从以下几个方面展开——
大家好,我叫陈鹏,来自腾讯。 前三位老师讲得都很有深度,干货满满。相比于前三位老师的深度,我今天分享的主题将会轻松一些,主要跟大家介绍腾讯看点在投放系统的探索,没有学术和深刻的原理,也没有目录,这里只有故事,跟着我的 PPT 一起开启一段故事吧。 在介绍投放系统之前,我想做个简单的调查,有多少人用过信息流产品?比如腾讯看点、今日头条等等。还挺多,那再问一下,在浏览信息流的时候,有多少人看到过令自己反感的内容?发现刚刚举手的同学基本也都举了手。这说明信息流中出现低质内容还是件挺常见的事,那该如何解决呢?这
在微博中,用户可以通过“关注”行为成为另一个用户的粉丝,“关注”行为是有向的。通过“关注”一个用户后,我们可以在我们的feed流中看到对方的信息。在微博中,通过这样的方式,我们可以接触到更多的信息。
基于邻域的算法是推荐系统中最基本的算法,在业界得到了广泛应用。基于邻域的算法分为两大类,一类是基于用户的协同过滤算法,另一类是基于物品的协同过滤算法。
题目: Graph Neural News Recommendation with Long-term and Short-term Interest Modeling
推荐系统中的核心是从海量的商品库挑选合适商品最终展示给用户。由于商品库数量巨大,因此常见的推荐系统一般分为两个阶段,即召回阶段和排序阶段。召回阶段主要是从全量的商品库中得到用户可能感兴趣的一小部分候选集,排序阶段则是将召回阶段得到的候选集进行精准排序,推荐给用户。
本文介绍的论文是:《Multi-Interest Network with Dynamic Routing for Recommendation at Tmall》
引言 微信读书 App 中的书籍推荐系统,逐渐开始在运营活动中(每周热榜、新手卡片)使用,尝试从技术侧帮助运营侧提高转活动的化率。 对微信读书的活跃用户,我们根据其读书时长、点评书等用户行为,做书籍推荐。对微信读书新增用户,由于缺少用户行为数据,无法使用这种方法做推荐,此类问题常被称为推荐系统冷启动问题。 然而,我们发现微信用户画像,比如基础属性(年龄、城市、性别等)和公众号阅读兴趣等,与微信读书用户的阅读兴趣相关。借助微信用户画像进行书籍推荐,准确率较随机推荐提升约 1 倍。 分析建模 如何评估微信用
4月8日,抖音电商首届生态大会在广州举行。这是该平台自2020年6月正式成立以来,首次举办行业大会。
本文为阿里DIN系列方法的简单总结,这里将会总结DIN系列文章的创新之处,以及相应的方法。DIN提出的原因我们在base model里面介绍。
作为【推荐系统】系列文章的第九篇,将以“序列化推荐算法”作为今天的主角,主要介绍相关的模型原理和发展方向。
©原创2015-02-06罗超 人们获取信息经历了几个大的阶段,从门户、搜索引擎再到推荐引擎,虽然载体有所不同,但每一次伴随着搅局者的强势入局,都会有覆盖性的技术创新。 现在移动时代信息大爆炸又对技术提出新的要求。姑且不论视频、直播、音频诸多新形态的多媒体内容,最为基础的资讯内容在自媒体、新媒体大潮中如同泄闸洪水涌向用户。用户不缺内容,缺的是在海量内容中找到想要所需的工具。新闻客户端、搜索引擎、微博、社交网络都在解决这个问题,让人们更高效和精准地获取内容。但最有机会解决资讯大爆炸的,或许是兴趣引擎。 移动内
标题:Mining Interest Trends and Adaptively Assigning Sample Weight for Session-based Recommendation 地址:https://arxiv.53yu.com/pdf/2306.11610.pdf 会议:SIGIR 2023 学校:清华
来源:PaperWeekly本文约2000字,建议阅读5分钟本文提出了一种新颖的顺序推荐系统 AutoMLP,旨在根据用户的历史交互更好地建模用户的长期/短期兴趣。 这是一篇 WWW 2023 多机构合作的文章,看这个题目 AutoMLP,就想起了 IJCAI 22 的一篇文章:MLP4Rec: A Pure MLP Architecture for Sequential Recommendations,果然是同一批人,属于是新瓶装旧酒,属于是“MLP is all you need”在长短期兴趣建模上的应
论文名称:《Next Item Recommendation with Self-Attention》 论文地址:https://arxiv.org/abs/1808.06414?context=cs
之前两篇讲过稠密特征和多值类别特征加入CTR预估模型的常用处理方法,这篇介绍一下针对序列特征采用的最基本的注意力机制方法。
Deep Interest Evolution Network for Click-Through Rate Prediction(AAAI2019)
本文介绍被CCF A类会议SIGIR2022接收的以用户为中心的对话推荐系统的论文。该论文从推荐系统的角度重新审视了现有的对话推荐工作,发现现有方法关注于当前会话的自然语言理解,而忽略了推荐任务中最核心的目标:用户。现有方法本质上当前会话的建模,而忽略了用户建模。而本文发现用户历史会话和相似用户信息也可以很好地辅助用户兴趣建模,特别是在用户当前会话信息较少(冷启动)的场景下效果更佳。
熟悉双塔的人都知道,在用户侧,模型最后往往都生成一个向量去检索,这个向量不足以表达用户的多兴趣,《Multi-Interest Network with Dynamic Routing for Recommendation at Tmall》这篇就提出了一个label-aware attention把用户表达为多个兴趣。
概念 个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。 为什么要个性化推荐? - 商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品 - 浏览大量无关的信息和产品,信息过载问题,用户难以获取所需要的信息 分类 基于内容的推荐 根据用户的历史数据,推荐用户感兴趣的产品。 1. 产品表示: 为每个item 抽取出一些 特征来表示此item;结构化属性如身高、学历、籍贯等;非结构化属性如item自己写的交友宣言,博客内容等等,需要转化成结
如下图 [1][2],阿里妈妈的精排模型,经历了从传统 LR、MLR 到深度模型 GwEN,再到用户兴趣建模的过程。
导读:58 同城作为一个 UV 千万量级的APP,覆盖了租房,招聘,二手房,二手车,本地生活,新房,新车等多个业务。在首页这个复杂的业务推荐场景下,我们面临着多业务融合挑战。如何利用从双通道到多通道到多场景适配的深度学习模型,实现涉及连接效率提升,增加商业收入,提高用户体验,优化用户流程,支持运营活动的各种目标的平衡。本文将以58同城首页猜你喜欢为例,将具体介绍实践多业务融合推荐场景下的深度学习模型应用,以及相关的工程实践。
摘要:这是广告系列的第一篇。广告的核心是服务广告主,为广告主圈定对应的人群从而达到好的广告转化效果。而在其中起到桥梁作用的就是标签。广告主会根据自身的性质选定一类或几类有明显特点的人群,这里用标签表示。而我们要做的就是给用户打上标签,然后提供给广告主使用。广告主选择标签,而标签后面则代表人群。本文基于实战项目介绍如何为广告主圈定人群以及如何刻画用户对标签的兴趣度得分。
推荐系统中的算法通过用户的历史行为数据挖掘用户的偏好,实现对用户偏好的建模,从而达到为用户推荐用户感兴趣的item。用户的兴趣偏好通常是多变的,而且是多样的。然而传统的基于item的协同过滤模型只能考虑用户的静态兴趣,而不能捕获用户的兴趣偏好的动态变化。
推荐系统技术,总体而言,与NLP和图像领域比,发展速度不算太快。不过最近两年,由于深度学习等一些新技术的引入,总体还是表现出了一些比较明显的技术发展趋势。这篇文章试图从推荐系统几个环节,以及不同的技术角度,来对目前推荐技术的比较彰显的技术趋势做个归纳。个人判断较多,偏颇难免,所以还请谨慎参考。
。意思是如果序列长度超过n,则使用最近n个行为。如果不足n,则从左侧做padding直到长度为n。
在当今信息爆炸的时代,传统的SEO手段已经不再足够。为了更好地满足用户个性化需求,我们需要突破传统SEO的限制,采用更智能、更个性化的优化方法。本文将介绍如何利用Python爬虫实现个性化搜索优化,让您的网站在用户搜索中脱颖而出。通过个性化搜索优化,您将能够更好地了解用户需求、提供符合用户兴趣的内容,并有效提升网站的排名与用户体验。
领取专属 10元无门槛券
手把手带您无忧上云