NewBeeNLP

文章/答案/技术大牛

发布

LV1

发表了文章 2024-07-312024-07-31 19:57:12

分水岭时刻！Llama3.1发布，405B超越闭源GPT-4o

在150多个基准测试集中，405B版本的表现追平甚至超越了现有SOTA模型GPT-4o和Claude 3.5 Sonnet。

NewBeeNLP 2024-07-312024-07-31 19:57:12

开源、安全、gpt、模型、人工智能

发表了文章 2024-07-312024-07-31 19:51:08

大模型Infra这些年，从黑铁时代到黄金时代再到白银时代

作者：方佳瑞，清华大学计算机科学技术博士；腾讯 · 专家工程师。声明：本文已经授权，版权归原作者！原文：https://zhuanlan.zhihu.co...

NewBeeNLP 2024-07-312024-07-31 19:51:09

模型、算法、开源、框架、论文

发表了文章 2024-07-222024-07-22 20:34:19

2024 META新作：SUM技术进行大规模在线用户表示，提升广告个性化效果

个性化推荐是现代在线广告的基础，既提升了广告主的回报也优化了用户体验。个性化的核心在于对用户的理解，过去主要依赖于人工设计的特征和简化的架构。以深度学习为基础的...

NewBeeNLP 2024-07-222024-07-22 20:34:20

sum、服务、模型、性能、meta

发表了文章 2024-07-122024-07-12 16:21:24

LEARN：百川大模型在快手推荐中的应用

这一两年推荐的论文工作离不开冷启和长尾问题，就像过去几年离不开序列和多目标一样，所套的壳子也从时序模型发展到对比学习和LLM，更像是“问题长期存在，我们现在有了...

NewBeeNLP 2024-07-122024-07-12 16:21:24

工作、论文、模型、推荐系统、embedding

发表了文章 2024-07-122024-07-12 16:20:53

Meta关于深度学习推荐系统的Scaling Law的研究

大家好，这里是 NewBeeNLP。今天看看 Meta 关于深度学习推荐系统 Scaling Law 的研究。

NewBeeNLP 2024-07-122024-07-12 16:20:54

scaling、数据、深度学习、推荐系统、meta

发表了文章 2024-06-272024-06-27 15:43:37

LEARN: LLM在快手电商广告推荐场景的应用

今天继续分享一篇大模型在推荐系统中的落地应用工作，是快手今年5月份发表的论文《Knowledge Adaptation from Large Language ...

NewBeeNLP 2024-06-272024-06-27 15:43:38

模型、排序、LLM、电商、工作

发表了文章 2024-06-272024-06-27 15:43:00

ACL 2024 | 多模态大模型能揭示图像背后的深意吗？

Can Large Multimodel Models Uncover Deep Semantics Behind Images?

NewBeeNLP 2024-06-272024-06-27 15:43:00

acl、测试、模型、数据、开源

发表了文章 2024-06-272024-06-27 15:42:22

ACL 2024 | 让纯LLM实现类人的符号逻辑推理能力，开源框架SymbCoT来了

Faithful Logical Reasoning via Symbolic Chain-of-Thought

NewBeeNLP 2024-06-272024-06-27 15:42:22

LLM、acl、翻译、开源框架、框架

发表了文章 2024-06-172024-06-17 12:32:15

聊一聊搜推广粗排思考

五花八门的说法越来越多，但是粗排的意义本质还是由于在工业界中业务链路性能、算力的约束下，漏斗链路设计中的一环，其使命就是在既定资源、性能约束下从全量候选集合中选...

NewBeeNLP 2024-06-172024-06-17 12:32:15

模型、排序、性能、优化、集合

发表了文章 2024-06-172024-06-17 11:28:38

用最酷的LR，训最猛的模型

预训练中，除了模型尺寸、数据、计算量之外，比较重要的就是batch size和learning rate这两个超参数了。从DeepSeek的scaling la...

NewBeeNLP 2024-06-172024-06-17 11:28:39

函数、模型、数据、优化、工作

发表了文章 2024-06-172024-06-17 11:25:51

搜推广生死判官：重排技术发展

全文1.2W字，PC阅读戳：https://f0jb1v8xcai.feishu.cn/wiki/LPlAwm6vSiesFBkysh8csZYfn1g

NewBeeNLP 2024-06-172024-06-17 11:25:52

搜索、模型、排序、实践、视频

发表了文章 2024-06-042024-06-04 13:55:30

从头预训练一只超迷你 LLaMA 3

这次打算用 Hugging Face 的 API 来写一份预训练大（小）模型的代码，也就是用 Trainer 来做预训练。由于只是想练习一下，因此打算选一个极小...

NewBeeNLP 2024-06-042024-06-04 13:55:30

配置、数据、工作、架构、模型

发表了文章 2024-06-042024-06-04 13:42:42

蚂蚁：多模态方向的技术探索

视频多模态检索在蚂蚁内部有着广泛的应用。视频多模态检索具体包括两个方向，一个是视频-文本的语义检索，另外一个是视频-视频的同源检索。

NewBeeNLP 2024-06-042024-06-04 13:42:42

存储、工作、模型、视频、数据

发表了文章 2024-06-042024-06-04 13:42:14

大模型预训练中的数据处理及思考

作者：赵亮，NLPer；昆仑万维 · 预训练。原文：https://zhuanlan.zhihu.com/p/641013454 整理: 青稞AI

NewBeeNLP 2024-06-042024-06-04 13:42:14

数据、网站、数据处理、论文、模型

发表了文章 2024-06-042024-06-04 13:39:30

NoteLLM: 大语言模型在小红书推荐系统的落地应用

今天分享一篇小红书今年3月的论文，介绍了大语言模型在小红书笔记推荐场景下的落地应用，主要是围绕如何利用LLM的表征能力来生成更适用于i2i召回的文本embedd...

NewBeeNLP 2024-06-042024-06-04 13:39:30

模型、压缩、推荐系统、笔记、论文

发表了文章 2024-05-222024-05-22 16:07:57

快手在召回场景GPT范式的尝试

RecGPT: Generative Personalized Prompts for Sequential Recommendation via ChatGP...

NewBeeNLP 2024-05-222024-05-22 16:07:57

数据、gpt、工作、函数、模型

发表了文章 2024-05-152024-05-15 18:35:53

「大模型」之所短，「知识图谱」之所长

去年 ChatGPT 问世的初期，还曾有声音说知识图谱已经过时了，将被大模型所替代。然而，随着这一年来的深入探讨和研究，目前业界普遍认为，大语言模型和知识图谱各...

NewBeeNLP 2024-05-152024-05-15 18:35:53

人工智能、安全、工具、模型

发表了文章 2024-05-142024-05-14 16:25:51

综述来啦！港大发布SSL4Rec：170篇「自监督学习」推荐算法

推荐系统对于应对信息过载挑战至关重要，它们根据用户的个人偏好提供定制化推荐。近年来深度学习技术极大地推动了推荐系统的发展，提升了对用户行为和偏好的洞察力。

NewBeeNLP 2024-05-142024-05-14 16:25:51

数据、推荐算法、监督学习、推荐系统、模型

发表了文章 2024-05-142024-05-14 12:29:30

DPO作者新作｜From r to Q*

本文几乎是DPO的原班人马搞的，新来的Joey Hejna是X-QL（本文部分核心理论）一作。这篇文章并没有提出一个新的算法，或者是在一个新的任务上刷了SOTA...

NewBeeNLP 2024-05-142024-05-14 12:29:31

算法、强化学习、函数、模型、数据

发表了文章 2024-05-142024-05-14 12:28:29

GPT-4o：深夜炸场，她来了！

在我们的深夜、太平洋时间的上午 10 点，OpenAI 召开春季发布会，推出了一款名为GPT-4o的“旗舰级”生成式人工智能模型，并将在未来几周内在公司面向开发...

NewBeeNLP 2024-05-142024-05-14 12:28:29

模型、数据、音频、语音、gpt

12 3 4 5 6 7 8...19 下一页

个人简介

暂未填写公司和职称
一个自然语言处理和人工智能的杂货铺子，希望能找到你喜欢的小玩意儿。欢迎关注公众号『NewBeeNLP』
机器学习深度学习人工智能
上海交通大学
http://kaiyuan.blog.csdn.net
北京
加入社区时间：2020-02-05

个人成就

获得 849 次赞同
文章被阅读 593.1K 次

关注了：1关注者：114

NewBeeNLP

分水岭时刻！Llama3.1发布，405B超越闭源GPT-4o

大模型Infra这些年，从黑铁时代到黄金时代再到白银时代

2024 META新作：SUM技术进行大规模在线用户表示，提升广告个性化效果

LEARN：百川大模型在快手推荐中的应用

Meta关于深度学习推荐系统的Scaling Law的研究

LEARN: LLM在快手电商广告推荐场景的应用

ACL 2024 | 多模态大模型能揭示图像背后的深意吗？

ACL 2024 | 让纯LLM实现类人的符号逻辑推理能力，开源框架SymbCoT来了

聊一聊搜推广粗排思考

用最酷的LR，训最猛的模型

搜推广生死判官：重排技术发展

从头预训练一只超迷你 LLaMA 3

蚂蚁：多模态方向的技术探索

大模型预训练中的数据处理及思考

NoteLLM: 大语言模型在小红书推荐系统的落地应用

快手在召回场景GPT范式的尝试

「大模型」之所短，「知识图谱」之所长

综述来啦！港大发布SSL4Rec：170篇「自监督学习」推荐算法

DPO作者新作｜From r to Q*

GPT-4o：深夜炸场，她来了！

个人简介

个人成就

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

NewBeeNLP

分水岭时刻！Llama3.1发布，405B超越闭源GPT-4o

大模型Infra这些年，从黑铁时代到黄金时代再到白银时代

2024 META新作：SUM技术进行大规模在线用户表示，提升广告个性化效果

LEARN：百川大模型在快手推荐中的应用

Meta关于深度学习推荐系统的Scaling Law的研究

LEARN: LLM在快手电商广告推荐场景的应用

ACL 2024 | 多模态大模型能揭示图像背后的深意吗？

ACL 2024 | 让纯LLM实现类人的符号逻辑推理能力，开源框架SymbCoT来了

聊一聊搜推广粗排思考

用最酷的LR，训最猛的模型

搜推广生死判官：重排技术发展

从头预训练一只超迷你 LLaMA 3

蚂蚁：多模态方向的技术探索

大模型预训练中的数据处理及思考

NoteLLM: 大语言模型在小红书推荐系统的落地应用

快手在召回场景GPT范式的尝试

「大模型」之所短，「知识图谱」之所长

综述来啦！港大发布SSL4Rec：170篇「自监督学习」推荐算法

DPO作者新作｜From r to Q*

GPT-4o：深夜炸场，她 来了！

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

GPT-4o：深夜炸场，她来了！