首页
学习
活动
专区
圈层
工具
发布

#缓存

缓存就是数据交换的缓冲区(称作Cache),当某一硬件要读取数据时,会首先从缓存中查找需要的数据,如果找到了则直接执行,找不到的话则从内存中找。缓存的作用是帮助硬件更快地运行。

Linux学习之dd命令使用

ICT系统集成阿祥

dd 命令的核心是数据读写与转换,所有操作都围绕「输入源」和「输出目标」展开,基础格式:

2700

如何设计一个扛住千万级流量的系统?

苏三说技术

1. 高性能:不是简单追求快,而是要在保证正确性的前提下,用有限的资源处理尽可能多的请求。我们的目标是核心接口P99响应时间低于100毫秒,单机QPS不低于50...

2910

Guava Cache和Caffeine,哪个更好?

苏三说技术

要理解Guava Cache和Caffeine的关系,我们需要先了解它们的历史渊源。

2900

向量搜索系统的三个核心优化维度:速度、精度与规模

deephub

有了缓存就不一样了。热门查询再来的时候系统先查缓存:Have we seen this query before? 命中的话直接返回存好的结果,Embeddin...

5810

Prompt 缓存的四种策略:从精确匹配到语义检索

deephub

自然语言理解、摘要生成、代码编写、逻辑推理,OpenAI 等厂商的模型把这些事情做得相当好。但是只有一个问题,那就是 “贵".尤其是在应用上了规模之后,API ...

7210

RAG 中分块重叠的 8 个隐性开销与权衡策略

deephub

RAG 分块重叠提升了召回率但增加了隐藏成本,比如说索引膨胀、Embedding 开销、延迟、重排序负载和评估漂移。

6210

NAS搭建游戏缓存服务器,Steam下载速度直接起飞

IT狂人日志

Lancache monolithic本质上是一个基于Nginx的HTTP缓存代理服务器。它的工作方式很简单:当局域网内任何设备下载游戏时,Lancache会拦...

9710

25:【HuggingFace】model下载超级慢 / ConnectionError → 国内镜像 & hf.co缓存

安全风信子

摘要: 本文详细分析2026年HuggingFace模型下载慢和ConnectionError的常见原因,提供了基于国内镜像和hf.co缓存的完整解决方案。文章...

34510

Java全栈工程师面试实战:从基础到项目落地的深度对话

用魔法才能打败魔法

一位Java全栈工程师的面试实录,涵盖技术栈、项目经验与代码实践。

8910

从基础到实战:Java全栈工程师的面试之旅

用魔法才能打败魔法

一位Java全栈工程师在面试中的真实对话与技术解答,涵盖Spring Boot、Vue3、Redis、Kafka等技术点。

9610

从Java到Vue:一位全栈工程师的面试实录

用魔法才能打败魔法

一位拥有5年经验的Java全栈工程师在面试中展示了自己的技术能力,涵盖了Java、Spring Boot、Vue等多个技术栈。

8510

58: vLLM 核心模块逐文件:kv_cache.py

安全风信子

作者:HOS(安全风信子) 日期:2026-01-21 来源平台:GitHub 摘要: 本文深入剖析 vLLM 核心缓存模块 kv_cache.py,揭示...

11210

51. vLLM 核心模块逐文件:engine.py

安全风信子

架构解读:LLMEngine作为核心协调者,连接了调度器、模型运行器和块管理器。调度器负责请求队列管理和批处理调度,模型运行器负责模型加载、前向计算和采样,块管...

10710

dotnet Vortice 通过 Angle 将 Skia 和 DirectX 对接

林德熙

本文将从控制台开始,以最简单方式和大家展示如何通过 Angle 将 Skia 和 DirectX 对接。对接之后,可以利用 Angle 的能力,让 Skia 使...

21611

MySQL高可用VIP配置避坑指南:/24还是/32?为什么漂移后访问不了?

俊才

而且为什么 VIP 漂移到新主机后,客户端连不上?是不是有缓存?不执行 arping 的话,要等多久才能生效?

14410

Memcache-部署和基本操作

运维小路

作者介绍:简历上没有一个精通的运维工程师。请点击上方的蓝色《运维小路》关注我,下面的思维导图也是预计更新的内容和当前进度(不定时更新)。

10310

Memcache-基本介绍和入门

运维小路

前进介绍Redis的各种特性,其实在内存数据库里面还有一个出现时间比他更早的缓存数据库:Memcached,他发布于2003年,比Redis发布时间更早。

13810

AI记忆革命爆发!Clawdbot如何像大脑般记住一切

新智元

问题来了:如果会话闲置时间超过了TTL,下个请求就没缓存了,必须按全价「缓存写入」费率重新缓存整个对话历史。

46410

malloc、calloc、kmalloc、vmalloc 详解

一个平凡而乐于分享的小比特

理解这些分配器的差异和适用场景,能够帮助开发者在不同环境下做出最优的内存管理决策。

11610

Clawdbot 是如何实现永久记忆的?

程序猿DD

Anthropic会对提示词前缀进行最多5分钟的缓存,以减少重复调用的延迟和成本。当相同的提示词前缀在TTL窗口内发送时,缓存的token成本降低约90%。TT...

46730
领券