首页
学习
活动
专区
圈层
工具
发布

#缓存

缓存就是数据交换的缓冲区(称作Cache),当某一硬件要读取数据时,会首先从缓存中查找需要的数据,如果找到了则直接执行,找不到的话则从内存中找。缓存的作用是帮助硬件更快地运行。

向量搜索系统的三个核心优化维度:速度、精度与规模

deephub

有了缓存就不一样了。热门查询再来的时候系统先查缓存:Have we seen this query before? 命中的话直接返回存好的结果,Embeddin...

3710

Prompt 缓存的四种策略:从精确匹配到语义检索

deephub

自然语言理解、摘要生成、代码编写、逻辑推理,OpenAI 等厂商的模型把这些事情做得相当好。但是只有一个问题,那就是 “贵".尤其是在应用上了规模之后,API ...

3100

RAG 中分块重叠的 8 个隐性开销与权衡策略

deephub

RAG 分块重叠提升了召回率但增加了隐藏成本,比如说索引膨胀、Embedding 开销、延迟、重排序负载和评估漂移。

2810

NAS搭建游戏缓存服务器,Steam下载速度直接起飞

IT狂人日志

Lancache monolithic本质上是一个基于Nginx的HTTP缓存代理服务器。它的工作方式很简单:当局域网内任何设备下载游戏时,Lancache会拦...

4700

25:【HuggingFace】model下载超级慢 / ConnectionError → 国内镜像 & hf.co缓存

安全风信子

摘要: 本文详细分析2026年HuggingFace模型下载慢和ConnectionError的常见原因,提供了基于国内镜像和hf.co缓存的完整解决方案。文章...

30710

Java全栈工程师面试实战:从基础到项目落地的深度对话

用魔法才能打败魔法

一位Java全栈工程师的面试实录,涵盖技术栈、项目经验与代码实践。

8810

从基础到实战:Java全栈工程师的面试之旅

用魔法才能打败魔法

一位Java全栈工程师在面试中的真实对话与技术解答,涵盖Spring Boot、Vue3、Redis、Kafka等技术点。

9510

从Java到Vue:一位全栈工程师的面试实录

用魔法才能打败魔法

一位拥有5年经验的Java全栈工程师在面试中展示了自己的技术能力,涵盖了Java、Spring Boot、Vue等多个技术栈。

8510

58: vLLM 核心模块逐文件:kv_cache.py

安全风信子

作者:HOS(安全风信子) 日期:2026-01-21 来源平台:GitHub 摘要: 本文深入剖析 vLLM 核心缓存模块 kv_cache.py,揭示...

10810

51. vLLM 核心模块逐文件:engine.py

安全风信子

架构解读:LLMEngine作为核心协调者,连接了调度器、模型运行器和块管理器。调度器负责请求队列管理和批处理调度,模型运行器负责模型加载、前向计算和采样,块管...

10610

dotnet Vortice 通过 Angle 将 Skia 和 DirectX 对接

林德熙

本文将从控制台开始,以最简单方式和大家展示如何通过 Angle 将 Skia 和 DirectX 对接。对接之后,可以利用 Angle 的能力,让 Skia 使...

21511

MySQL高可用VIP配置避坑指南:/24还是/32?为什么漂移后访问不了?

俊才

而且为什么 VIP 漂移到新主机后,客户端连不上?是不是有缓存?不执行 arping 的话,要等多久才能生效?

14310

Memcache-部署和基本操作

运维小路

作者介绍:简历上没有一个精通的运维工程师。请点击上方的蓝色《运维小路》关注我,下面的思维导图也是预计更新的内容和当前进度(不定时更新)。

10210

Memcache-基本介绍和入门

运维小路

前进介绍Redis的各种特性,其实在内存数据库里面还有一个出现时间比他更早的缓存数据库:Memcached,他发布于2003年,比Redis发布时间更早。

13710

AI记忆革命爆发!Clawdbot如何像大脑般记住一切

新智元

问题来了:如果会话闲置时间超过了TTL,下个请求就没缓存了,必须按全价「缓存写入」费率重新缓存整个对话历史。

45510

malloc、calloc、kmalloc、vmalloc 详解

一个平凡而乐于分享的小比特

理解这些分配器的差异和适用场景,能够帮助开发者在不同环境下做出最优的内存管理决策。

11410

Clawdbot 是如何实现永久记忆的?

程序猿DD

Anthropic会对提示词前缀进行最多5分钟的缓存,以减少重复调用的延迟和成本。当相同的提示词前缀在TTL窗口内发送时,缓存的token成本降低约90%。TT...

45530

建议收藏!Supervisor 动态 Skills 知识库架构设计方案

臻成AI大模型

4. 缓存 (Caching):将解析后的内容序列化为 JSON 格式,独立缓存,与 Capability Cards 完全隔 离。

15610

为什么RAG总是重复做无用功?看完CAG就懂了

臻成AI大模型

更重要的是,CAG不仅仅是缓存,它还有智能识别能力。系统会自动判断哪些内容适合缓存,哪些需要实时检索。比如股价、天气这种实时数据,就不适合缓存;而公司制度、产品...

9910

企业级人脸识别系统架构与实现:从零到一构建高性能智能识别平台

Harry技术

随着人工智能技术的快速发展,人脸识别已经成为智能化应用的重要组成部分。本文将基于实际项目经验,详细介绍如何构建一个高性能、可扩展的企业级人脸识别系统。

12710
领券