首页
学习
活动
专区
圈层
工具
发布

#缓存

缓存就是数据交换的缓冲区(称作Cache),当某一硬件要读取数据时,会首先从缓存中查找需要的数据,如果找到了则直接执行,找不到的话则从内存中找。缓存的作用是帮助硬件更快地运行。

容器启动慢到怀疑人生?这几招我用下来,启动时间直接砍半

悠悠12138

这样写一来是合并成一层,二来 rm -rf 清掉了 apt 的缓存,不然那些缓存文件会留在这一层里白白占体积。

300

最近的一些杂感-202606

jeanron100

我统计了下自己最近的一些token消耗情况,94%以上都是走缓存的,所以看起来token数字比较高, 如果按照输出token不走缓存大概在400万tokens/...

900

读者点单·05|Token 节省专题:把 AI 编程账单砍 60% 的 7 个工程化手段

陆业聪

这是降本效果最显著的一招。原理很简单:Claude API 的 Prompt Caching 机制会缓存 system prompt 和靠前的 messages...

900

GPT-5.6来了,强到没边,但普通人还摸不到

Ai学习的老章

以前 OpenAI 的命名简直是灾难,5、5.1、5-pro、5-mini、o1、o3……普通用户根本分不清谁强谁弱

1100

Go 切片截取后,为什么大数组迟迟无法释放?

技术圈

调用方拿到的返回值只有 1 KiB,但这 1 KiB 仍然引用 100 MiB 底层数组。如果它被放入缓存、结构体字段或异步任务闭包,大数组就会跟着一起长期驻留...

1100

Coinbase把AI支出砍了近一半,Token用量却还在涨

用户11563501

有做相关产品的公司也下场留言,Redis的团队说他们专门做了面向Agent的Prompt缓存工具Langcache,就是解决缓存复用的问题;还有做开源LLM网关...

800

一道LLM推理部署面试题:KV缓存淘汰90% token,显存为什么没降?

用户11563501

如果你对KV缓存的工作机制还比较模糊,有开发者做了GPT-2的2D和3D可视化工具(llm-visualized.com,需在设置中开启KV缓存模式),可以直观...

1200

C盘:我真的快滴出血了!uv:别怕,我这就带你搬家去D盘

小田测测看

uv 默认会将 Python 解释器和缓存塞进用户目录下(通常是 C 盘)。我们要自定义路径,彻底解救 C 盘。

1000

使用 kkRepo 搭建 Python PyPI 私服

kl博主

kkRepo 的一个重要设计点是面向多副本部署:session、权限、token、迁移状态等共享状态存储在 MySQL 中,进程内缓存只作为可重建的本地热缓存。...

7110

面试官追问:Java 中 1==1 为 true,1000==1000 为啥是 false?答案就在这

HELLO程序员

GSK(中国) | 全栈架构师 (已认证)

Java 就开始 “耍小聪明” 了:它根本不会新建两个对象,而是直接把缓存好的同一个 Integer 实例给你。

7300

2026年全球LLM定价权演进、商业模式重构与成本效益分析深度报告

jeffery_jcm

在人工智能发展史上,2026年被视为大语言模型(LLM)从“技术奇点”转向“产业奇点”的关键节点。这一转变的核心驱动力已不再仅仅是模型参数规模的线性扩张,而是围...

17010

使用 kkRepo 搭建 Maven 私服

kl博主

kkRepo 的一个重要设计点是面向多副本部署:session、权限、token、迁移状态等共享状态存储在 MySQL 中,进程内缓存只作为可重建的本地热缓存。...

8310

大模型 API 到底在卖什么?把 Token 成本一次讲透

唐国梁Tommy

不过各平台缓存规则不同:有的要求前缀够长,有的有缓存有效期,有的要显式设置缓存断点。不能简单理解成"文字一样就一定命中"。

12410

想让LLM多想几轮,又不想显存爆炸?MELT 把循环 Transformer 的 KV 缓存解耦了

唐国梁Tommy

也就是说,每一层只有一份 KV 缓存,每个 token 在循环里反复迭代时,新算出来的 K、V 不再写到缓存的新行里,而是和原行做一次门控融合,落回原位置。整套...

10710

Claude Code 源码曝光 :1884 个文件拆完之后,Claude Code 到底是什么?

唐国梁Tommy

Claude Code 把系统提示分成静态段和动态段,静态段(身份声明、系统规则、任务执行哲学等)在会话内只计算一次,并打上 cache_control 标记,...

11000

MoR如何通过动态递归深度实现模型轻量化与高性能?参数共享与自适应计算的完美融合

唐国梁Tommy

KV缓存是Transformer高效推理的基石,但MoR的动态性给它带来了新挑战——缓存中会出现因token提前退出而产生的“空洞”。为此,论文设计了两种专门的...

8810

LRU算法在Redis和MySQL中的区别

码农戏码

缓存污染问题说的是缓存中一些只会被访问一次或者几次的的数据,被访问完后,再也不会被访问到,但这部分数据依然留存在缓存中,消耗缓存空间

11000

生成式AI这一年,我踩过的坑和你可能也会遇到

用户12493922

9610
领券