NewBeeNLP

代码在线跑，知识轻松学

Python精品学习库

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

博客搬家 | 分享价值百万资源包

往期视频·干货材料·成员作品 最新动态

技术创作特训营·精选知识专栏

新邀入驻腾讯云开发者社区，福利多多！

💡 社交互动怎样突破实时音视频卡顿与高流量消耗瓶颈？

🚀 短剧制作效率低下，AI如何辅助实现智能提效？

在150多个基准测试集中，405B版本的表现追平甚至超越了现有SOTA模型GPT-4o和Claude 3.5 Sonnet。

分水岭时刻！Llama3.1发布，405B超越闭源GPT-4o

作者：方佳瑞，清华大学 计算机科学技术博士；腾讯 · 专家工程师。
声明：本文已经授权，版权归原作者！
原文：https://zhuanlan.zhihu.com/p/708594043

大模型Infra这些年，从黑铁时代到黄金时代再到白银时代

个性化推荐是现代在线广告的基础，既提升了广告主的回报也优化了用户体验。个性化的核心在于对用户的理解，过去主要依赖于人工设计的特征和简化的架构。以深度学习为基础的推荐系统的发展改变了这一格局，其利用复杂的神经网络模型来学习微妙的用户表示。

2024 META新作：SUM技术进行大规模在线用户表示，提升广告个性化效果

这一两年推荐的论文工作离不开冷启和长尾问题，就像过去几年离不开序列和多目标一样，所套的壳子也从时序模型发展到对比学习和LLM，更像是“问题长期存在，我们现在有了更好的工具解决”，鸡生蛋与蛋生鸡总是这么的迷人和无所遁形。

LEARN：百川大模型在快手推荐中的应用

大家好，这里是 NewBeeNLP。今天看看 Meta 关于深度学习推荐系统 Scaling Law 的研究。

Meta关于深度学习推荐系统的Scaling Law的研究

今天继续分享一篇大模型在推荐系统中的落地应用工作，是快手今年5月份发表的论文《Knowledge Adaptation from Large Language Model to Recommendation for Practical Industrial Application》。

LEARN: LLM在快手电商广告推荐场景的应用

Can Large Multimodel Models Uncover Deep Semantics Behind Images?

ACL 2024 | 多模态大模型能揭示图像背后的深意吗？

Faithful Logical Reasoning via Symbolic Chain-of-Thought

ACL 2024 | 让纯LLM实现类人的符号逻辑推理能力，开源框架SymbCoT来了

五花八门的说法越来越多，但是粗排的意义本质还是由于在工业界中业务链路性能、算力的约束下，漏斗链路设计中的一环，其使命就是在既定资源、性能约束下从全量候选集合中选出一个“优质候选集合”

聊一聊搜推广粗排思考

预训练中，除了模型尺寸、数据、计算量之外，比较重要的就是batch size和learning rate这两个超参数了。从DeepSeek的scaling law工作[1]中可以看到，不同的学习率可以让loss有一定的波动，影响模型收敛。

用最酷的LR，训最猛的模型

全文1.2W字，PC阅读戳：https://f0jb1v8xcai.feishu.cn/wiki/LPlAwm6vSiesFBkysh8csZYfn1g

搜推广生死判官：重排技术发展

这次打算用 Hugging Face 的 API 来写一份预训练大（小）模型的代码，也就是用 Trainer 来做预训练。由于只是想练习一下，因此打算选一个极小模型 + 小数据集。为了贴近主流，于是打算预训练一个 LLaMA 3——不过是超迷你版本，大小仅不到 20M。

从头预训练一只超迷你 LLaMA 3

视频多模态检索在蚂蚁内部有着广泛的应用。视频多模态检索具体包括两个方向，一个是视频-文本的语义检索，另外一个是视频-视频的同源检索。

蚂蚁：多模态方向的技术探索

作者：赵亮，NLPer；昆仑万维 · 预训练。 
原文：https://zhuanlan.zhihu.com/p/641013454
整理:  青稞AI

大模型预训练中的数据处理及思考

今天分享一篇小红书今年3月的论文，介绍了大语言模型在小红书笔记推荐场景下的落地应用，主要是围绕如何利用LLM的表征能力来生成更适用于i2i召回的文本embedding，思路简单，落地也容易，个人觉得实践价值非常高，值得学习。

NoteLLM: 大语言模型在小红书推荐系统的落地应用

RecGPT: Generative Personalized Prompts for Sequential Recommendation via ChatGPT Training Paradigm

快手在召回场景GPT范式的尝试

去年 ChatGPT 问世的初期，还曾有声音说知识图谱已经过时了，将被大模型所替代。然而，随着这一年来的深入探讨和研究，目前业界普遍认为，大语言模型和知识图谱各有所长，能够互相补充[1,2]。

「大模型」之所短，「知识图谱」之所长

推荐系统对于应对信息过载挑战至关重要，它们根据用户的个人偏好提供定制化推荐。近年来深度学习技术极大地推动了推荐系统的发展，提升了对用户行为和偏好的洞察力。

综述来啦！港大发布SSL4Rec：170篇「自监督学习」推荐算法

本文几乎是DPO的原班人马搞的，新来的Joey Hejna是X-QL（本文部分核心理论）一作。这篇文章并没有提出一个新的算法，或者是在一个新的任务上刷了SOTA，主要是对DPO算法给出了一个理论解释，统一了处理LLM强化学习任务的两个视角，即序列决策还是单步决策。用强化学习的语言就是说dense or sparse reward，r or Q*。而后者这个Q*有不禁让人联想到OPENAI“泄露的Q*计划”。应该说还是有其理论价值的。

DPO作者新作｜From r to Q*

在我们的深夜、太平洋时间的上午 10 点，OpenAI 召开春季发布会，推出了一款名为GPT-4o的“旗舰级”生成式人工智能模型，并将在未来几周内在公司面向开发者和消费者的产品中迭代推出。该模型将向免费客户开放，这意味着任何人都可以通过 ChatGPT 访问 OpenAI 最先进的技术。

GPT-4o：深夜炸场，她 来了！

文章

问答

视频

学习中心

腾讯云实验室

直播

竞赛

腾讯云架构师技术同盟交流圈

腾讯云数据库专区

腾讯云顾问专区

腾讯云原生专区

腾讯混元专区

腾讯云TCE专区

腾讯云Lighthouse专区

腾讯云HAI专区

腾讯云Edgeone专区

腾讯云存储专区

腾讯云智能专区

腾讯轻联专区 

腾讯云开发专区

TAPD专区

腾讯轻量云游戏服专区

腾讯云最具价值专家

腾讯云架构师技术同盟

腾讯云创作之星

腾讯云开发者先锋 

腾讯云代码助手

CODING DevOps

Cloud Studio

SDK中心

API中心

命令行工具

腾讯云开发者社区推出了NewBeeNLP专栏，为你提供了NewBeeNLP的相关文章，致力于帮助开发者快速成长与发展。

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐