首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

芯流独家:瑞芯微开发端侧算力芯片,AloT市场保卫战打响

【摘要】据知情人士透露,瑞芯微正开发一款代号为“贡嘎一号”的端侧大模型算力AI芯片,采用Wafer on Wafer(3D堆叠)的结构设计。

值得关注的是,该芯片带宽高达1T/s即每秒1TB,相较当于目前主流端侧芯片带宽指标有明显提升的10倍。

瑞芯微开发这一高带宽性能芯片,旨在应对视觉安防、智能座舱等领域客户被竞争对手蚕食的潜在风险,是其巩固AIoT(智能物联网)市场的关键一步。

以下为正文:

据知情人士透露,瑞芯微正开发一款代号为“贡嘎一号”的端侧大模型算力AI芯片,采用Wafer on Wafer(3D堆叠)的结构设计。

该产品最核心的亮点在于芯片带宽。

据悉,该芯片带宽高达1T/s即每秒1TB,可以覆盖3B至7B范围内的端侧AI大模型。

从技术上看,AI大模型芯片运行端侧大模型主要取决于两大指标。

其中,算力决定了大模型首次计算的延迟程度,算力越大延迟往往越低,而后续的计算与输出基于初次计算的积累,对算力及数据量要求并不高。

此时,带宽成为决定大模型后续输出速度的另一核心指标。

该指标关乎存储模块与芯片间互联的性能,决定从DDR接口到计算单元缓存的速度。

目前,主流端侧芯片带宽多为100G,瑞芯微1T/s的带宽有明显提升是该领域常规芯片的10倍,就该指标来看,瑞芯微正在开发的A端侧I端侧芯片具有较高的市场竞争力,而具体性能表现,还要看后续市场应用情况。

那么,瑞芯微为何要卷带宽呢?

从业务布局来看,瑞芯微在AIoT(智能物联网)领域深耕多年,其RK3588系列芯片广泛应用于安防摄像头、车载座舱、工业控制等领域。

然而,随着AI大模型向端侧渗透,市场对于大模型实时处理与快速反应的能力提出了更高要求,瑞芯微的市场份额受到业内部分企业的冲击。

尽管公司在短时间内满足车规级AI端侧芯片的性能要求,但凭借着高带宽带来的输出效率提升,或可巩固原有视觉安防及端侧座舱领域的客户。

业内人士表示,高带宽AI端侧芯片的成本往往较高,瑞芯微的芯片将在国内流片,可降低部分成本。

端侧AI芯片的竞争已经从单纯算力比拼,转向算力与带宽的综合较量。

瑞芯微能否凭借端侧算力芯片稳住市场份额,还要看市场的真实反馈。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OU0m3a1sfd_3ZuyiwwsTIaMQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券