芯流独家：瑞芯微开发端侧算力芯片，AloT市场保卫战打响

文章来源：企鹅号 - 芯流智库

【摘要】据知情人士透露，瑞芯微正开发一款代号为“贡嘎一号”的端侧大模型算力AI芯片，采用Wafer on Wafer(3D堆叠)的结构设计。

值得关注的是，该芯片带宽高达1T/s即每秒1TB，相较当于目前主流端侧芯片带宽指标有明显提升的10倍。

瑞芯微开发这一高带宽性能芯片，旨在应对视觉安防、智能座舱等领域客户被竞争对手蚕食的潜在风险，是其巩固AIoT（智能物联网）市场的关键一步。

以下为正文：

据知情人士透露，瑞芯微正开发一款代号为“贡嘎一号”的端侧大模型算力AI芯片，采用Wafer on Wafer(3D堆叠)的结构设计。

该产品最核心的亮点在于芯片带宽。

据悉，该芯片带宽高达1T/s即每秒1TB，可以覆盖3B至7B范围内的端侧AI大模型。

从技术上看，AI大模型芯片运行端侧大模型主要取决于两大指标。

其中，算力决定了大模型首次计算的延迟程度，算力越大延迟往往越低，而后续的计算与输出基于初次计算的积累，对算力及数据量要求并不高。

此时，带宽成为决定大模型后续输出速度的另一核心指标。

该指标关乎存储模块与芯片间互联的性能，决定从DDR接口到计算单元缓存的速度。

目前，主流端侧芯片带宽多为100G，瑞芯微1T/s的带宽有明显提升是该领域常规芯片的10倍，就该指标来看，瑞芯微正在开发的A端侧I端侧芯片具有较高的市场竞争力，而具体性能表现，还要看后续市场应用情况。

那么，瑞芯微为何要卷带宽呢？

从业务布局来看，瑞芯微在AIoT（智能物联网）领域深耕多年，其RK3588系列芯片广泛应用于安防摄像头、车载座舱、工业控制等领域。

然而，随着AI大模型向端侧渗透，市场对于大模型实时处理与快速反应的能力提出了更高要求，瑞芯微的市场份额受到业内部分企业的冲击。

尽管公司在短时间内满足车规级AI端侧芯片的性能要求，但凭借着高带宽带来的输出效率提升，或可巩固原有视觉安防及端侧座舱领域的客户。

业内人士表示，高带宽AI端侧芯片的成本往往较高，瑞芯微的芯片将在国内流片，可降低部分成本。

端侧AI芯片的竞争已经从单纯算力比拼，转向算力与带宽的综合较量。

瑞芯微能否凭借端侧算力芯片稳住市场份额，还要看市场的真实反馈。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货