NewBeeNLP

文章/答案/技术大牛

发布

LV1

全部文章

分水岭时刻！Llama3.1发布，405B超越闭源GPT-4o
在150多个基准测试集中，405B版本的表现追平甚至超越了现有SOTA模型GPT-4o和Claude 3.5 Sonnet。
NewBeeNLP 2024-07-312024-07-31 19:57:12
开源、安全、gpt、模型、人工智能
大模型Infra这些年，从黑铁时代到黄金时代再到白银时代
作者：方佳瑞，清华大学计算机科学技术博士；腾讯 · 专家工程师。声明：本文已经授权，版权归原作者！原文：https://zhuanlan.zhihu.co...
NewBeeNLP 2024-07-312024-07-31 19:51:09
模型、算法、开源、框架、论文
2024 META新作：SUM技术进行大规模在线用户表示，提升广告个性化效果
个性化推荐是现代在线广告的基础，既提升了广告主的回报也优化了用户体验。个性化的核心在于对用户的理解，过去主要依赖于人工设计的特征和简化的架构。以深度学习为基础的...
NewBeeNLP 2024-07-222024-07-22 20:34:20
sum、服务、模型、性能、meta
LEARN：百川大模型在快手推荐中的应用
这一两年推荐的论文工作离不开冷启和长尾问题，就像过去几年离不开序列和多目标一样，所套的壳子也从时序模型发展到对比学习和LLM，更像是“问题长期存在，我们现在有了...
NewBeeNLP 2024-07-122024-07-12 16:21:24
工作、论文、模型、推荐系统、embedding
Meta关于深度学习推荐系统的Scaling Law的研究
大家好，这里是 NewBeeNLP。今天看看 Meta 关于深度学习推荐系统 Scaling Law 的研究。
NewBeeNLP 2024-07-122024-07-12 16:20:54
scaling、数据、深度学习、推荐系统、meta
LEARN: LLM在快手电商广告推荐场景的应用
今天继续分享一篇大模型在推荐系统中的落地应用工作，是快手今年5月份发表的论文《Knowledge Adaptation from Large Language ...
NewBeeNLP 2024-06-272024-06-27 15:43:38
模型、排序、LLM、电商、工作
ACL 2024 | 多模态大模型能揭示图像背后的深意吗？
Can Large Multimodel Models Uncover Deep Semantics Behind Images?
NewBeeNLP 2024-06-272024-06-27 15:43:00
acl、测试、模型、数据、开源
ACL 2024 | 让纯LLM实现类人的符号逻辑推理能力，开源框架SymbCoT来了
Faithful Logical Reasoning via Symbolic Chain-of-Thought
NewBeeNLP 2024-06-272024-06-27 15:42:22
LLM、acl、翻译、开源框架、框架
聊一聊搜推广粗排思考
五花八门的说法越来越多，但是粗排的意义本质还是由于在工业界中业务链路性能、算力的约束下，漏斗链路设计中的一环，其使命就是在既定资源、性能约束下从全量候选集合中选...
NewBeeNLP 2024-06-172024-06-17 12:32:15
模型、排序、性能、优化、集合
用最酷的LR，训最猛的模型
预训练中，除了模型尺寸、数据、计算量之外，比较重要的就是batch size和learning rate这两个超参数了。从DeepSeek的scaling la...
NewBeeNLP 2024-06-172024-06-17 11:28:39
函数、模型、数据、优化、工作
搜推广生死判官：重排技术发展
全文1.2W字，PC阅读戳：https://f0jb1v8xcai.feishu.cn/wiki/LPlAwm6vSiesFBkysh8csZYfn1g
NewBeeNLP 2024-06-172024-06-17 11:25:52
搜索、模型、排序、实践、视频
从头预训练一只超迷你 LLaMA 3
这次打算用 Hugging Face 的 API 来写一份预训练大（小）模型的代码，也就是用 Trainer 来做预训练。由于只是想练习一下，因此打算选一个极小...
NewBeeNLP 2024-06-042024-06-04 13:55:30
配置、数据、工作、架构、模型
蚂蚁：多模态方向的技术探索
视频多模态检索在蚂蚁内部有着广泛的应用。视频多模态检索具体包括两个方向，一个是视频-文本的语义检索，另外一个是视频-视频的同源检索。
NewBeeNLP 2024-06-042024-06-04 13:42:42
存储、工作、模型、视频、数据
大模型预训练中的数据处理及思考
作者：赵亮，NLPer；昆仑万维 · 预训练。原文：https://zhuanlan.zhihu.com/p/641013454 整理: 青稞AI
NewBeeNLP 2024-06-042024-06-04 13:42:14
数据、网站、数据处理、论文、模型
NoteLLM: 大语言模型在小红书推荐系统的落地应用
今天分享一篇小红书今年3月的论文，介绍了大语言模型在小红书笔记推荐场景下的落地应用，主要是围绕如何利用LLM的表征能力来生成更适用于i2i召回的文本embedd...
NewBeeNLP 2024-06-042024-06-04 13:39:30
模型、压缩、推荐系统、笔记、论文
快手在召回场景GPT范式的尝试
RecGPT: Generative Personalized Prompts for Sequential Recommendation via ChatGP...
NewBeeNLP 2024-05-222024-05-22 16:07:57
数据、gpt、工作、函数、模型
「大模型」之所短，「知识图谱」之所长
去年 ChatGPT 问世的初期，还曾有声音说知识图谱已经过时了，将被大模型所替代。然而，随着这一年来的深入探讨和研究，目前业界普遍认为，大语言模型和知识图谱各...
NewBeeNLP 2024-05-152024-05-15 18:35:53
人工智能、安全、工具、模型
综述来啦！港大发布SSL4Rec：170篇「自监督学习」推荐算法
推荐系统对于应对信息过载挑战至关重要，它们根据用户的个人偏好提供定制化推荐。近年来深度学习技术极大地推动了推荐系统的发展，提升了对用户行为和偏好的洞察力。
NewBeeNLP 2024-05-142024-05-14 16:25:51
数据、推荐算法、监督学习、推荐系统、模型
DPO作者新作｜From r to Q*
本文几乎是DPO的原班人马搞的，新来的Joey Hejna是X-QL（本文部分核心理论）一作。这篇文章并没有提出一个新的算法，或者是在一个新的任务上刷了SOTA...
NewBeeNLP 2024-05-142024-05-14 12:29:31
算法、强化学习、函数、模型、数据
GPT-4o：深夜炸场，她来了！
在我们的深夜、太平洋时间的上午 10 点，OpenAI 召开春季发布会，推出了一款名为GPT-4o的“旗舰级”生成式人工智能模型，并将在未来几周内在公司面向开发...
NewBeeNLP 2024-05-142024-05-14 12:28:29
模型、数据、音频、语音、gpt

12 3 4 5 6 7 8...19 下一页

个人简介

暂未填写公司和职称
一个自然语言处理和人工智能的杂货铺子，希望能找到你喜欢的小玩意儿。欢迎关注公众号『NewBeeNLP』
机器学习深度学习人工智能
上海交通大学
http://kaiyuan.blog.csdn.net
北京
加入社区时间：2020-02-05

个人成就

获得 849 次赞同
文章被阅读 592.7K 次

关注了：1关注者：114

NewBeeNLP

全部文章

分水岭时刻！Llama3.1发布，405B超越闭源GPT-4o

大模型Infra这些年，从黑铁时代到黄金时代再到白银时代

2024 META新作：SUM技术进行大规模在线用户表示，提升广告个性化效果

LEARN：百川大模型在快手推荐中的应用

Meta关于深度学习推荐系统的Scaling Law的研究

LEARN: LLM在快手电商广告推荐场景的应用

ACL 2024 | 多模态大模型能揭示图像背后的深意吗？

ACL 2024 | 让纯LLM实现类人的符号逻辑推理能力，开源框架SymbCoT来了

聊一聊搜推广粗排思考

用最酷的LR，训最猛的模型

搜推广生死判官：重排技术发展

从头预训练一只超迷你 LLaMA 3

蚂蚁：多模态方向的技术探索

大模型预训练中的数据处理及思考

NoteLLM: 大语言模型在小红书推荐系统的落地应用

快手在召回场景GPT范式的尝试

「大模型」之所短，「知识图谱」之所长

综述来啦！港大发布SSL4Rec：170篇「自监督学习」推荐算法

DPO作者新作｜From r to Q*

GPT-4o：深夜炸场，她来了！

个人简介

个人成就

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

NewBeeNLP

分水岭时刻！Llama3.1发布，405B超越闭源GPT-4o

大模型Infra这些年，从黑铁时代到黄金时代再到白银时代

2024 META新作：SUM技术进行大规模在线用户表示，提升广告个性化效果

LEARN：百川大模型在快手推荐中的应用

Meta关于深度学习推荐系统的Scaling Law的研究

LEARN: LLM在快手电商广告推荐场景的应用

ACL 2024 | 多模态大模型能揭示图像背后的深意吗？

ACL 2024 | 让纯LLM实现类人的符号逻辑推理能力，开源框架SymbCoT来了

聊一聊搜推广粗排思考

用最酷的LR，训最猛的模型

搜推广生死判官：重排技术发展

从头预训练一只超迷你 LLaMA 3

蚂蚁：多模态方向的技术探索

大模型预训练中的数据处理及思考

NoteLLM: 大语言模型在小红书推荐系统的落地应用

快手在召回场景GPT范式的尝试

「大模型」之所短，「知识图谱」之所长

综述来啦！港大发布SSL4Rec：170篇「自监督学习」推荐算法

DPO作者新作｜From r to Q*

GPT-4o：深夜炸场，她 来了！

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

GPT-4o：深夜炸场，她来了！