scaling - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签scaling

#scaling

DeepMind爆火论文：向量嵌入模型存在数学上限，Scaling laws放缓实锤？

机器之心 2025-09-022025-09-02 17:28:53

这几天，一篇关于向量嵌入（Vector Embeddings）局限性的论文在 AlphaXiv 上爆火，热度飙升到了近 9000。

19910

深入解析强化学习中的混合精度训练：FP16累加误差与Loss Scaling补偿机制

用户6320865 2025-08-272025-08-27 15:15:08

在深度学习领域，混合精度训练已成为加速模型训练的核心技术之一。这项技术通过巧妙结合FP16（半精度浮点数）和FP32（单精度浮点数）两种数据格式，在保证模型精度...

27610

简单几步解决神器Burp Suite 光标错位问题

逍遥子大表哥 2025-07-312025-07-31 14:36:27

其问题归根在于缩放位置上面，接下来我们一起解决此问题。首先点击Setting->User interface->Display->Scaling缩放设置为2(...

48610

奖励模型终于迎来预训练新时代！上海AI Lab、复旦POLAR，开启Scaling新范式

机器之心 2025-07-122025-07-12 15:16:38

在大语言模型后训练阶段，强化学习已成为提升模型能力、对齐人类偏好，并有望迈向 AGI 的核心方法。然而，奖励模型的设计与训练始终是制约后训练效果的关键瓶颈。

13010

OpenAI去年挖的坑填上了！奖励模型首现Scaling Law，1.8B给70B巨兽上了一课

新智元 2025-07-122025-07-12 14:38:45

【新智元导读】最近，一款全新的奖励模型「POLAR」横空出世。它开创性地采用了对比学习范式，通过衡量模型回复与参考答案的「距离」来给出精细分数。不仅摆脱了对海量...

11600

原来Scaling Law还能被优化？Meta这招省token又提效

机器之心 2025-07-082025-07-08 14:33:11

此外，他们的实验还表明，2-simplicial Transformer 相对于 Transformer 具有更有利的参数数量 scaling 指数。这表明，与...

10510

英伟达笑到最后！训练2000步，1.5B逆袭7B巨兽，Scaling真来了

新智元 2025-06-232025-06-23 11:12:53

后训练拓展（Post-training scaling）利用微调（fine-tuning）、剪枝（pruning）、蒸馏（distillation）和强化学习等...

19910

复旦大学/上海创智学院邱锡鹏：Context Scaling，通往AGI的下一幕

机器之心 2025-06-162025-06-16 11:27:31

2024 年底，Ilya Sutskever 断言「我们所知的预训练时代即将终结」，让整个人工智能领域陷入对 Scaling What 的集体追问之中。

19010

英伟达揭示RL Scaling魔力！训练步数翻倍=推理能力质变，小模型突破推理极限

机器之心 2025-06-102025-06-10 13:34:58

强化学习（RL）到底是语言模型能力进化的「发动机」，还是只是更努力地背题、换个方式答题？这个问题，学界争论已久：RL 真能让模型学会新的推理技能吗，还是只是提高...

14300

突破大模型推理瓶颈！首篇「Test-Time Scaling」全景综述，深入剖析AI深思之道

机器之心 2025-05-142025-05-14 10:15:48

本文由来自香港城市大学、麦吉尔大学（McGill）、蒙特利尔人工智能实验室（MILA）、人大高瓴人工智能学院、Salesforce AI Research、斯坦...

33010

机器人的「物理图灵测试」，英伟达Jim Fan 17分钟演讲揭秘具身Scaling Law

机器之心 2025-05-122025-05-12 10:21:33

如果你把这个方法放到 scaling 图上，你会发现它根本不能 scale。真实机器人数据的获取是在拿人力当燃料，这比用化石燃料更糟糕。而且，一个机器人每天只有...

16910

苹果提出原生多模态Scaling Law！早融合+MoE，性能飙升秘密武器

新智元 2025-05-062025-05-06 14:18:15

一种常用方法是把单独预训练好的模型组合起来，比如把训练好的视觉编码器连接到LLM的输入层，再进行多模态训练。

19410

AI长身体，直接做实验！自主通用科学家，科研界的Scaling Law来了

新智元 2025-05-052025-05-05 14:05:48

你能想象未来的诺贝尔奖颁奖典礼上，站在领奖台上的不是人类科学家，而是一个机器人吗？

23610

后训练时代如何延续Scaling Law？这是你该读的LLM后训练综述

机器之心 2025-05-022025-05-02 23:32:59

为了解决这些难题，强化学习（RL）被引入进来；这能让模型使用动态的反馈和优化序列决策来提升适应能力。此外，包括低秩适应（LoRA）、适配器和检索增强生成（RAG...

20700

72B世界基座模型启动，小鹏的端到端智驾正在验证Scaling Laws

机器之心 2025-04-182025-04-18 15:38:11

作为公认的新范式，它可以让整个智能驾驶系统反应更快，更加拟人，能处理以往方法无法解决的大量 corner case，被认为是自动驾驶通向 L3、L4 的正确方向...

24100

苹果发现原生多模态模型Scaling Laws：早融合优于后融合，MoE优于密集模型

机器之心 2025-04-132025-04-13 15:57:07

为了将损失建模为训练 token 数量 D 和模型参数 N 的函数，他们还拟合了以下参数函数，得到了 scaling 指数 α = 0.301 和 β = 0....

18110

比 R1 快 8 倍、价格仅 3%，智谱新推理模型来袭，能让免费智能体自己赚钱！张鹏：Agent 也有 Scaling Law

深度学习与Python 2025-04-052025-04-05 14:26:48

刚刚，智谱推出最新的 AutoGLM 沉思模型，不仅具备深度研究能力（Deep Research），还能实现实际操作（Operator）。并且，这个会“边想边干...

22310

刚刚，DeepSeek公布推理时Scaling新论文，R2要来了？

机器之心 2025-04-052025-04-05 14:20:11

这会是 DeepSeek R2 的雏形吗？本周五，DeepSeek 提交到 arXiv 上的最新论文正在 AI 社区逐渐升温。

16910

谷歌重磅推出全新Scaling Law，抢救Transformer！3万亿美元AI面临岔路

新智元 2025-03-172025-03-17 19:32:32

刚刚，谷歌研究员Zachary Charles宣布：「在越来越大的模型上，分布式训练取得重大突破」。

14100

Ilya错了？Scaling另有他用，ViT大佬力挺谷歌1000亿数据新发现

新智元 2025-03-102025-03-10 20:58:14

ViT大佬翟晓华（Xiaohua Zhai）并不这样认为，至少在多模态模型上并非如此。

13810