首页
学习
活动
专区
圈层
工具
发布

#缓存

缓存就是数据交换的缓冲区(称作Cache),当某一硬件要读取数据时,会首先从缓存中查找需要的数据,如果找到了则直接执行,找不到的话则从内存中找。缓存的作用是帮助硬件更快地运行。

Elasticsearch simdvec 深度解析:在内存的钢丝上行走,实现向量吞吐量翻倍

点火三周

CPU 缓存被组织成缓存行和组。缓存行是数据在内存层次结构中传输的单位;在 ARM 和 x86 上,它都是 64 字节长。每个缓存行精确地映射到一个缓存组,并且...

700

搞了次性能优化,结果出乎意料!

程序员鱼皮

2)进一步优化,使用性能更高的 Redis 分布式缓存。将分页查询结果作为 JSON 字符串写入缓存,再次查询的时候直接读取就行。

500

2025 最新 Redis 学习路线,保姆级教程

程序员鱼皮

鱼皮:那就搭建 多级缓存,比如服务器本地内存缓存 => Redis 分布式缓存 => 数据库,层层过滤。用户请求先查本地缓存,没有再查 Redis,还没有才查数...

3010

老弟第一次学 Redis,被坑惨了!

程序员鱼皮

鱼皮:那就搭建 多级缓存,比如服务器本地内存缓存 => Redis 分布式缓存 => 数据库,层层过滤。用户请求先查本地缓存,没有再查 Redis,还没有才查数...

2010

AI 拨测,怎么才算真的测到位

用户1127067

这层只看生成本身利不利索——撞上 max_token 被截断、该按 stop 停的没停、长文本输入输出对不上、回了一段空的、中转站该命中的缓存没命中。这些接口可...

6810

AF_Cache:面向高通量蛋白质相互作用预测的 AlphaFold 高效化流程

DrugIntel

但这些链当中,互不相同的单体其实只有 N 个。也就是说,默认流程把每个单体的比对重复计算了约 (N+1) 次。AF_Cache 的做法是:对一组去重后的单体,所...

9210

【开源】共工skill技能包-助力技术面试

AI 生命克劳德

目标就是:输入一份自己的简历,自动生成简历风险诊断、面试追问清单、模拟面试题和准备优先级。

6810

基于 Skills 的缺陷定位与根因分析体系

AI智享空间

不是那种一眼能看出来的 NPE(空指针异常),不是那种日志里清清楚楚写着“数据库连接失败”的错误。而是那种:系统运行正常,日志没有报错,监控指标平稳,但用户就是...

12710

Claude Code 的工具延迟加载机制

CandyTong

腾讯 | 前端开发 (已认证)

模型的 prompt cache 以 system prompt 的前缀匹配为基础。如果工具列表在两次请求之间发生变化——比如 MCP 服务器重连后工具数量变了...

11010

2026年了,后端程序员还有必要死磕八股文吗?

王中阳AI编程

面试官问:"Redis 缓存击穿你怎么处理?" 小伙伴张口就来:"互斥锁、布隆过滤器、永不过期……"

12410

综合实战:构建功能完备的 AI IDE 能力层

安全风信子

作者: HOS(安全风信子) 日期: 2026-05-24 主要来源平台: GitHub 摘要: 本篇文章是第三卷的综合实战章节,旨在将前29篇文章中构建...

14100

Cache System:多级缓存与缓存一致性

安全风信子

作者: HOS(安全风信子) 日期: 2026-05-25 主要来源平台: GitHub 摘要: 缓存是AI IDE性能优化的关键基础设施。从Token缓...

11310

【DeepSeek 实战】降本增效:DeepSeek V4 推理成本控制与生产环境监控

行者全栈架构师

随着 DeepSeek V4 在企业内部的广泛应用,API 调用量呈指数级增长。如何在保证服务质量的同时控制成本,成为每个技术团队必须面对的课题。

23610

缓存技术:从CPU Cache到AI KV Cache (四)Web缓存

霞姐聊IT

Web缓存体系形成了多层协作结构:浏览器缓存→ 反向代理缓存 → CDN → P2P 。每层缓存利用不同局部性原理:

11310

【万字长文】LLM 缓存这笔账,藏着多少猫腻?

用户1127067

关键是它有没有把普通输入、缓存写入、缓存读取分开。只返回一个总 input token,这条链路就少了一半信息——可能真没缓存,也可能缓存了没透传,光看总 to...

17910

ollama v0.30.2 正式发布:自动安装 Cline CLI、Radeon 核显兼容、缓存 Token 统计、llama.cpp 升级完整实测文档

福大大架构师每日一题

Ollama v0.30.2于2026年6月3日正式上线,本次版本累计提交15次代码变更,修改38个代码文件,包含安全漏洞修复、llama.cpp内核版本升级、...

50320

PDF预览分片

IT小马哥

人民教育出版社 | Java开发工程师 (已认证)

PDF.js 是一个非常强大的 JavaScript 库,用于在网页中渲染 PDF 文档。它的分片加载(或称为流式加载)是其性能优化的一部分,允许在需要时按需加...

11610

缓存技术:从CPU Cache到AI KV Cache (三)数据库缓存

霞姐聊IT

本质上,数据库缓存并不是单纯缓存“数据”,而是在缓存SQL执行链路上最昂贵的中间结果。

13010

快被KV Cache搞破产了

乐小野

石化盈科信息技术有限责任公司 | 算法工程师 (已认证)

他把手机推过来,给我看监控面板:40%的A100显存被一个叫KV Cache的东西吃掉了。而且用户越多,对话越长,它吃得越狠。

14910

【AI内参】SciMaster:突破 20 万 Token 瓶颈,ML-Master 2.0 开启“长程自主科学”新纪元

乐小野

石化盈科信息技术有限责任公司 | 算法工程师 (已认证)

ML-Master 2.0 舍弃了 1.0 版本中侧重于并行搜索引导的“自适应内存”,转而引入了受计算机多级缓存系统启发、更具生物学深度的“分层认知缓存(HCC...

11510
领券