首页
学习
活动
专区
圈层
工具
发布

#内存

Go 切片截取后,为什么大数组迟迟无法释放?

技术圈

接口只返回前 100 条记录,进程内存却一直很高;日志解析只保留几 KB 头部信息,几十 MiB 的缓冲区却迟迟不降。这类问题经常被误判为 GC 不够积极,实际...

300

显存大就一定跑得快?一文看懂AI芯片容量与带宽的核心误区

GPUS Lady

在AI大模型算力芯片的宣传中,显存容量一直是最抓人眼球的参数。近期AMD新一代AI加速卡MI455X对标英伟达Rubin芯片,凭借1.5倍的显存容量赚足了关注度...

000

存储芯片价格Q3将飙升50%,Q4将再涨40%!

芯智讯

6月27日消息,投资银行杰富瑞(Jefferies)在最新发布的研报中发出严厉警告,全球存储芯片价格的上涨势头远未结束,2026年下半年将出现远超市场预期的价格...

300

高通公布数据中心Roadmap,目标2029年拿下150亿美元!

芯智讯

当地时间6月25日,高通技术公司在其投资者日活动上宣布其数据中心战略,并推出一系列全新的数据中心解决方案,包括高通 Dragonfly(飞龙) C1000 CP...

000

DRAM价格暴涨,苹果也扛不住了!

芯智讯

6月25日消息,据外媒wccftech报道,凭借全球超过15亿台活跃装置建立的庞大生态,苹果公司历来拥有行业独一档的供应链议价能力,甚至能通过一年以上的长约锁定...

100

业绩炸裂!美光Q3净利暴增12倍,毛利率碾压英伟达!

芯智讯

美东时间6月24日盘后,存储芯片大厂美光科技(Micron Technology)公布了其2026财年第三季度(截至2026年5月28日)的财务报告。财报数据显...

300

RDPPlus v12 更新 -- 运维工具箱

科控物联

8款 Sysinternals 神器 + PowerShell 管理 · 一站式 Windows 运维

100

RDPPlus v12 更新 -- 设备与系统设置

科控物联

摄像头、蓝牙、磁盘清理、内存优化一应俱全 · 你的 Power User 生存工具箱

100

一道LLM推理部署面试题:KV缓存淘汰90% token,显存为什么没降?

用户11563501

用vLLM部署推理模型,长序列推理时频繁爆显存。于是给服务加了KV缓存压缩策略,淘汰90%的非重要缓存token,重启后显存占用几乎没变,还是会在相近的序列长度...

300

电脑价格 “一天一个价”,涨价太猛了:去年不到7000元,今年12000元

程序员小猿

日前,苹果公司宣布,上调全球多个市场部分笔记本电脑和平板电脑售价,涨幅在16%至25%不等。毕业季数码产品热销,国内市场上多款热门电脑机型售价也出现大幅上调。

400

Hermes Agent:揭秘四层内存系统与学习循环

HELLO程序员

GSK(中国) | 全栈架构师 (已认证)

大多数智能体顶多能记住发生过什么,Hermes 则直接更进一步:它会把管用的方法抽出来,写成可复用的技能,下次碰到类似问题直接开抄作业。这套学习循环是全自动跑的...

8410

面试官追问:Java 中 1==1 为 true,1000==1000 为啥是 false?答案就在这

HELLO程序员

GSK(中国) | 全栈架构师 (已认证)

说白了,a == b问的不是 “a 和 b 的值是不是一样”,而是 “这两个变量是不是指着内存里同一个对象”。

7000

英伟达在五年内能到10万亿美元,抓住英伟达就抓住了未来

PikeTalk

英伟达的市值目前已经超过所有大型制药公司的总和,无论是有机还是无机,只要是物质合成,就会越来越依赖加速计算。

4810

本地零成本:养🦞龙虾-OpenClaw 只需三步

jeffery_jcm

当Google DeepMind推出Gemma4小模型之后,本地推理实现了质的飞跃;

9700

想让LLM多想几轮,又不想显存爆炸?MELT 把循环 Transformer 的 KV 缓存解耦了

唐国梁Tommy

过去两年,让大模型"会思考"的主流路径是 Chain-of-Thought:模型在给答案前先把推理过程一段段地"说出来"。它有效,但也有清晰的代价——输出越长,...

10710

一文读懂 NVIDIA 与 Sakana AI 联手打造的稀疏 LLM 黑科技

唐国梁Tommy

在 AI 圈,Scaling Law 几乎被奉为真理:模型越大,性能越强。但这个“强”是有代价的。动辄数千亿参数的模型,不仅让推理成本(VRAM、延迟)变成天文...

9910

Transformer之后,谁主沉浮?一文梳理大模型高效架构的演进脉络

唐国梁Tommy

理解FlashAttention的关键在于理解现代GPU的存储层次结构:速度极快但容量很小的SRAM(片上内存)和速度较慢但容量巨大的HBM(高带宽内存)。标准...

9000

Kinetics 伸缩法则:重估LLM测试时推理中的计算与内存访问成本

唐国梁Tommy

最近大语言模型(LLM)的浪潮一波接一波,模型参数越来越大,能力也越来越强。但随之而来的,是推理成本的急剧攀升。我们常常追求大力出奇迹,希望用更大的模型、更多的...

12410

通过hs_err_pid日志文件分析Java进程崩溃原因

码农戏码

之前出现过内存泄漏,但这次通过grafana查看,各项指标看着也正常,内存没有大幅上升

12310

半个月搞定一次堆外内存泄漏排查

码农戏码

服务通过 - Xmx=6G 指定最大堆分配为 6G,但实际 RSS 已达到 11G,开始怀疑堆外内存是否有内存泄露。

9100
领券