首页
学习
活动
专区
圈层
工具
发布

#token

《万级 Token 消耗之谜:为什么修改几行代码会触发 AI 的“全文重写”?》

沈宥

AI 编程助手(如 GitHub Copilot, Cursor)的出现,极大地提升了开发者的编码效率。然而,随着使用频率的增加和模型能力的增强(尤其是支持超长...

14610

Nature | 智源 Emu3 登顶:终结扩散模型霸权?下一代多模态大模型只需 预测下一个 Token

DrugOne

参考文献: Wang, X., Cui, Y., Wang, J. et al. Multimodal learning with next-token pre...

12810

【教程】零成本白嫖 ClawdBot :Gemini CLI + 本地中转方案

Mirza Zhao

OpenClaw最近很火,但是却是一个十足的token吞金兽,如果你不想消耗昂贵的 token,只想部署玩玩,利用 Google 每天提供给开发者的免费请求额度...

1.3K100

50. Harmony Format 解析:vLLM的统一 token 化方案

安全风信子

Harmony Format是vLLM提出的一种统一tokenization方案,旨在解决不同模型间tokenization碎片化的问题。它通过设计一种通用的t...

8210

关于多模态大模型Token压缩技术进展,看这一篇就够了

机器之心

近年来多模态大模型在视觉感知,长视频问答等方面涌现出了强劲的性能,但是这种跨模态融合也带来了巨大的计算成本。高分辨率图像和长视频会产生成千上万个视觉 token...

22510

估值35亿美元,LeCun创业公司官宣核心方向,掀起对Next-token范式的「叛变」

机器之心

一直以来,LeCun 都对现有大语言模型的发展持怀疑态度,认为仅靠预测下一个 token 的生成式模型无法真正做到理解现实世界。他提出了世界模型这一不同路径,一...

13810

人工智能 | 高速公路相关的人工智能基础知识普及:算力、参数与TOKEN

高速公路那点事儿

为什么说TOKEN,这是AI时代最好的度量衡,因为我们在使用大模型服务的时候,收费的情况下都是按照token进行核算的。

17310

Token花在哪了?Claude Code消耗监控统计神器(四种实用方法)

测试开发技术

最近AI圈里,大家都在分享Claude Skills,如果你还不知道什么是Skills,可以看看这篇:最近很火爆的Claude Skills到底是个啥?解决什么...

66810

34. Token 级调度原理

安全风信子

作者:HOS(安全风信子) 日期:2026-01-19 来源平台:GitHub 摘要: 2026年,Token级调度已成为大模型推理系统性能突破的关键技术...

10510

微信小程序送补贴!手把手教你薅免费云开发资源+混元Token(附使用教程)

腾讯云开发者

登录成功后,进去云开发控制台,点击左侧菜单栏 的AI菜单后,就可以在 AI下的大模型目录中,分别点击生文模型和生图模型,就可以查看赠送到的混元生文模型1 亿 t...

56410

大模型|MoE混合专家系统介绍

AI老马

输入分配:根据路由分数,每个 token 选择 2 个专家,最终专家接收的 token 数可能不同。如专家 1 接 5 个 token(X1:5×128),专家...

31410

KV cache - 高效推理必备技术

AI老马

大模型推理的解码阶段,生成单个token时,Q值需要使用全部序列token的KV值计算注意力,但除当前新token的KV值外,其他token的KV值已经在上一轮...

31810

AAAI 2026 | 小鹏联合北大,专为VLA模型定制视觉token剪枝方法,让端到端自动驾驶更高效

机器之心

VLA 模型正被越来越多地应用于端到端自动驾驶系统中。然而,VLA 模型中冗长的视觉 token 极大地增加了计算成本。但现有的视觉 token 剪枝方法都不是...

17010

4个月烧掉30亿Token,这位「菜鸟」程序员做出50多个产品,360万人围观

机器之心

长久以来,代码世界的大门似乎只对少数掌握秘术的人敞开。我们被告知:你必须先理解内存、掌握语法、忍受枯燥的文档,才配谈论创造。

18210

AI+Drug 文献速递 | Token-Mol 1.0,首个仅用标记的3D药物设计模型,为 AI 驱动药物发现提供新方向

MindDance

期刊: Nature Communications 链接: https://doi.org/10.1038/s41467-025-59628-y 代码: htt...

10710

微信发布AI小程序成长计划:免费云开发资源+1亿token额度!

腾讯云开发TCB

Tencent Technology (Shenzhen) Company Limited | 云开发(TCB)团队 (已认证)

AI大模型技术加速爆发,应用开发门槛持续降低,加上iOS虚拟支付在微信生态的全面落地,应用变现的“短板”已被补齐。基建完善,又迎平台扶持——

2K60

Mamba作者团队提出SonicMoE:一个Token舍入,让MoE训练速度提升近2倍

机器之心

Token rounding 算法首先计算基础的 TC(token-choice)路由结果,并对每个 expert 对应的 token 按路由分数进行排序,之后...

20210

SpringSecurity、Shiro和Sa-Token,哪个更好?

苏三说技术

今天我们来聊聊一个让很多Java开发者纠结的技术选型问题:Spring Security、Apache Shiro和Sa-Token,这3个主流安全框架到底该选...

24110

CALM自编码器:用连续向量替代离散token,生成效率提升4倍

deephub

过去这些年语言模型的效率优化基本围绕着两条主线展开:参数规模和注意力机制的复杂度。但有个更根本的问题一直被忽视,那就是自回归生成本身的代价。这种逐token生成...

11610
领券