暂无搜索历史
本文发现特征频率与特征emb的最高特征值之间存在正相关性,这种相关性凸显了参数空间中损失的不平衡分布,使得传统的优化器很难发现有效泛化的平坦的最小值,而导致将模...
本文针对ctr预估中如何进行有效的特征交互提出新的方法。目前的方法主要集中于对单个样本内的特征交互进行建模,而忽略了潜在的跨样本间的关系,这些关系可以作为增强预...
LLM4CTR在训练推理中主要存在以下问题:LLM在处理长文本用户行为时的效率很低,随着用户序列的增长,LLM的效率无法对数十亿用户和商品进行训练。
相对于传统的ID形式的推荐系统(IDRec),本文在模型中引入预训练模型,但预训练模型的参数很多,会导致延迟增加。因此,大部分无法在推荐系统中使用。本文提出一种...
传统的多场景推荐系统(MSRS)通常不加区别的使用所有相关的特征,忽视了特征在不同场景下的不同重要性,往往会导致模型性能下降。本文提出了多场景特征选择(Mult...
Scaling laws在nlp,cv领域的模型改进方面起着重要作用,但是目前推荐模型并没有表现出类似于在大型语言模型领域观察到的规律,本文在模型本身结构上做出...
本文是华为提出用于客户生命价值预测(LTV)的对比学习多视角网络(CMLTV),主要针对目前存在的LTV预估方法采用单视角建模导致准确度低和知识提取存在偏差的问...
本文主要针对序列推荐中的多行为序列推荐,即行为序列中包含不同的行为类型,比如点击,加购,购买等。为了捕获用户的个性化行为模式和行为间的复杂协作关系,作者提出PB...
本文是快手提出的用在工业场景的用户生命周期(LTV)预测方案,主要思想有三部分:1.提出了有序依赖单调网络(ODMN, Order Dependency Mon...
本文是针对LTV(生命周期价值)预估,提出的相关方法。主要是在以往LTV预估方法的基础上去额外考虑“鲸鱼”用户的分布,所谓鲸鱼用户就是具有高消费能力的用户,以游...
本文是针对触发诱导推荐(Trigger-Induced Recommendation,TIR)提出的推荐算法,所谓TIR就是比如在大促活动会场点击某个item后...
本文是针对多场景CTR预估中的特征交互提出的相关改进方法,利用LLM构建通用特征交互网络。常规的方法在迁移到新的推荐域会存在一定的问题,因为它们依赖于ID特征(...
本文主要针对多任务学习在推荐系统中应用时的负迁移问题提出的相关方法。现有的方法通常是在所有样本中探索负迁移性,忽略了其中固有的复杂性。作者根据任务之间的相对正反...
本文主要是针对CTR预估中数据稀疏性问题提出的相关方法,再原有的ctr预估模型中引入了一个辅助匹配任务,通过对比学习来提高点击率预测精度(AT4CTR)。两个受...
传统的CTR预估模型,是将表格型数据转换为ont hot向量,然后考虑特征之间的交互来推断用户的偏好,但是这种方式忽略了特征的语义信息。现有的LLM推荐方法图P...
简单汇总了一下LLM4Rec的最新进展,希望对大家有帮助,部分文章已经解读过,后续也会对其中的一些有趣的文章进行阅读。
随着电商平台数据的不断积累,每个用户都会积累大量的历史行为数据,形成一个超级长的行为序列。超长序列推荐的问题应运而生,其研究在用户行为序列非常长的情况下,如何利...
标题:ControlRec: Bridging the Semantic Gap between Language Model and Personalized...
大规模语言模型的蓬勃发展带来了许多潜在的机遇,然而,幻觉问题却成为实际应用落地前需要克服的重要障碍。幻觉表现为模型生成的内容与用户输入、模型输出上下文或实际事实...
本文主要是针对ctr预估中特征交互方面提出的相关方法,是对DCNv2的改进。DCN和DCNv2可以参考https://zhuanlan.zhihu.com/p/...
暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市