首页
学习
活动
专区
圈层
工具
发布

#内存

Hermes Agent:揭秘四层内存系统与学习循环

HELLO程序员

GSK(中国) | 全栈架构师 (已认证)

Hermes Agent 是 Nous Research 打造的一款开源 AI 智能体。和主打多智能体协同调度的 OpenClaw 不同,Hermes 是单打独...

400

面试官追问:Java 中 1==1 为 true,1000==1000 为啥是 false?答案就在这

HELLO程序员

GSK(中国) | 全栈架构师 (已认证)

那会儿我刚好不容易搞懂 Java 的自动装箱(autoboxing),心里美滋滋地想:“太妙了!基本类型和对象总算能近乎无缝混用了,日子终于好过了😭”

000

英伟达在五年内能到10万亿美元,抓住英伟达就抓住了未来

PikeTalk

英伟达的市值目前已经超过所有大型制药公司的总和,无论是有机还是无机,只要是物质合成,就会越来越依赖加速计算。

200

本地零成本:养🦞龙虾-OpenClaw 只需三步

jeffery_jcm

当Google DeepMind推出Gemma4小模型之后,本地推理实现了质的飞跃;

1200

想让LLM多想几轮,又不想显存爆炸?MELT 把循环 Transformer 的 KV 缓存解耦了

唐国梁Tommy

过去两年,让大模型"会思考"的主流路径是 Chain-of-Thought:模型在给答案前先把推理过程一段段地"说出来"。它有效,但也有清晰的代价——输出越长,...

3510

一文读懂 NVIDIA 与 Sakana AI 联手打造的稀疏 LLM 黑科技

唐国梁Tommy

在 AI 圈,Scaling Law 几乎被奉为真理:模型越大,性能越强。但这个“强”是有代价的。动辄数千亿参数的模型,不仅让推理成本(VRAM、延迟)变成天文...

2910

Transformer之后,谁主沉浮?一文梳理大模型高效架构的演进脉络

唐国梁Tommy

理解FlashAttention的关键在于理解现代GPU的存储层次结构:速度极快但容量很小的SRAM(片上内存)和速度较慢但容量巨大的HBM(高带宽内存)。标准...

3800

Kinetics 伸缩法则:重估LLM测试时推理中的计算与内存访问成本

唐国梁Tommy

最近大语言模型(LLM)的浪潮一波接一波,模型参数越来越大,能力也越来越强。但随之而来的,是推理成本的急剧攀升。我们常常追求大力出奇迹,希望用更大的模型、更多的...

3810

通过hs_err_pid日志文件分析Java进程崩溃原因

码农戏码

之前出现过内存泄漏,但这次通过grafana查看,各项指标看着也正常,内存没有大幅上升

4110

半个月搞定一次堆外内存泄漏排查

码农戏码

服务通过 - Xmx=6G 指定最大堆分配为 6G,但实际 RSS 已达到 11G,开始怀疑堆外内存是否有内存泄露。

4300

堆外内存泄漏排查方式

码农戏码

第三方的 Native 库内存无法 track,不能 Trace JNI 里直接调用 malloc 时的内存分配,典型场景如 ZipInputStream 场景

1800

Java内存区域划分及JVM参数

码农戏码

1、JVM 的内存被分为了不同的区域,主要由 Java 堆内存、非堆内存组成,在 Linux 上,JVM 通过 glibc 与 OS 进行内存分配与去配。

2210

Java内存分析利器:Native Memory Tracking

码农戏码

•作用:GC 相关的数据结构(如 Card Table、Remembered Set 等)•reserved=206MB:预留的 GC 内存•committed...

3510

JVM参数AlwaysPreTouch作用是什么

码农戏码

RES(resident memory usage):又称为 RSS,是进程在 RAM 中真正占用的内存大小。RES 包含了它所链接的动态库被加载到物理内存中的...

3100

CMS和G1的7点区别

码农戏码

通过将堆划分为多个Region,实现了空间的整合,降低了内存碎片的产生,提高了内存的利用率。

3600

读者点单·04|Android 内存治理实战:从 PSS 看到 LeakCanary 的全链路

陆业聪

• 谷歌 Android 17 给 App 内存占用套上"紧箍咒":新版系统引入更严格的内存效率指引,官方建议开发者使用 Glide/Coil 管理 Bitma...

3910

2.198EFlops!时隔8年,中国超算重回全球第一!

芯智讯

LX2还采用了类似日本“富岳”超算A64FX处理器的混合内存设计:每个LX2处理器集成了8个总计32GB容量HBM高带宽内存,总带宽达到4TB/s,同时支持最高...

6210

SK海力士增产DDR5,追逐超90%理论毛利率

芯智讯

目前,SK海力士超过40%的营收来自HBM,这一比例远超三星电子。得益于在AI用高端内存上的先发优势,SK海力士在巩固HBM市场的同时,积极寻求在传统DRAM领...

2810

JEDEC通过SPHBM4标准:信号引脚减少75%,传输速率提升至4倍

芯智讯

随着人工智能(AI)与高性能计算(HPC)对高带宽内存(HBM)的需求持续暴增,高昂的成本与封装技术限制已成为产业发展的重大瓶颈。为了解决此问题,固态技术协会(...

5810

从 printf 到屏幕:程序和硬件之间发生了什么

Lihua奏

所有 Windows 规定:只有内核态的驱动才能用 in/out,普通程序使用直接报错

3610
领券