专栏首页量子位拥抱AI大趋势,ARM发布两款AI芯片架构

拥抱AI大趋势,ARM发布两款AI芯片架构

今天,ARM发布了两款针对移动终端的AI芯片架构,物体检测(Object Detection,简称OD)处理器和机器学习(Machine Learning,简称ML)处理器。

以往,ARM都是架构准备好了,才发公告。这次一反常态,没货却先发公告:OD处理器,计划在第一季度才能提供给合作伙伴;ML处理器得等到年中。

这也看出了ARM很焦急。

毕竟在过去的几个月中,尤其是在移动端圈子里,机器学习在半导体行业中很热。

好几家提供芯片架构的公司都宣布了提供消费者解决方案,连华为都开始自主研发架构了。那么多玩家入场,ARM却没啥动作。

直到现在,ARM才把重点放在了Armv8.2的CPU ISA扩展上,该扩展借助半精度浮点和整数点产品来简化和加速神经网络的专用指令。

除了CPU的改进之外,还看到了G72中机器学习的GPU改进。虽然这两项改进都有所帮助,但想要最大性能和效率,这些改进还不够。

在测试Kirin 970的NPU和Qualcomm的DSP时,可以看出,专用架构上运行推理的效率,比在CPU上运行的效率高出一个数量级以上。

正如ARM官方解释的那样,Armv8.2和GPU的改进只是建立机器学习解决方案的第一步,还必须研究对专用解决方案的需求。

ARM也从合作的小伙伴那里感受到了行业的压力,才熬出来ML处理器。

下面简单介绍一下这次发布的两个新的架构:机器学习ML处理器以及OD处理器。

ML处理器,是专门为加速神经网络模型推理所设计的。这种架构比传统的CPU和GPU架构有明显的优势。

在执行机器学习任务时,这款ML处理器可为数据优化内存管理。

这款处理器具有数据可高度重复使用的特点,能最大限度地减少数据的输入和输出,从而实现高性能和高效率。

ML处理器,理论上可在1.5W功率下,有超过4.6TOPs(8位整数)的理论吞吐量,最高可达3TOPs / W。

虽然TOPs值并不能完全体现处理器的性能,不过它对于行业标准化仍然有用。

作为一个完全独立的独立IP(电路功能)模块,ML处理器具有自己的ACE-Lite接口,可集成到SoC中,也可以集成到DynamiQ中。

此外,ARM没有透露ML处理器更多的架构信息。

OD处理器,是针对物体检测的任务进行了优化。尽管ML处理器也能完成相同的任务,但OD处理器可以更快。给单项任务提供专用架构,才能够获得最大效率。

ARM也考虑到了可能会出现OD和ML处理器集成在一起用的情况:OD处理器负责把图像中的目标处理区分割出来,然后把它们传递给ML处理器,进行更细颗粒度的处理。

ARM还提供大量软件,帮助开发人员将他们的神经网络模型应用到不同的NN框架中。从今天开始,这些软件大家可以在ARM开发者网站找到,同时也在Github上提供。

考虑到SoC开发的周期,基于新架构的芯片大概得在2019年年中或年末才能发布。ARM这次,可以说半导体及架构供应商中响应AI趋势比较慢的企业了。

最后,附编译来源:

https://www.anandtech.com/show/12427/arm-announces-trillium-machine-learning-ip

本文分享自微信公众号 - 量子位(QbitAI)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-02-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 最全中文深度学习入门书:小白易入,课程代码PPT全有 | 复旦邱锡鹏出品

    可能对于大部分中国AIer来说,语言门槛高过了一座大山。网红课虽好,但是英语听不懂啊。

    量子位
  • 英伟达CEO手撕谷歌TPU:P80性能比它强2倍!

    李杉 李林 编译整理 量子位 出品 | 公众号 QbitAI ? 上周,Google发表论文,详解了神经网络推断专用芯片TPU的架构,还展示了一些性能数据,比如...

    量子位
  • 谷歌TPU2代有望取代英伟达GPU?测评结果显示…

    去年5月,谷歌推出了第二代TPU芯片,这是一个自定义开发的深度学习加速芯片,不少人认为有望成为英伟达GPU的替代品。

    量子位
  • Intel与ARM处理器对比分析

    复杂指令集比精简指令集的实现要多用很多晶体管,导致复杂指令集架构天生比精简指令集架构更复杂、功耗更大。

    党志强
  • 要问技术多NB,请问IO模型知多少? | 下篇

    解决NIO的思路就是降解无效的系统调用,如何降解呢?我们一起来看看以下几种IO多路复用的解决思路。

    码农架构
  • 嵌入式系统降低功耗的设计技术

    电源通常被认为是整个嵌入式系统的“心脏”,绝大多数电子设备50%~80%的节能潜力在于电源系统。研制开发新型开关电源是节能的主要举措之一。 近年来许多公司相继推...

    不脱发的程序猿
  • Python 基础(七):字典与集合

    我清楚的记得,刚上小学时老师就让每一个学生准备一本新华字典,它的使用大家也应该都清楚,通过拼音、偏旁部首等进行查询;今天我们说的字典(dict)是 Python...

    Python小二
  • 从刷机开始学ARM

    ①ARM是一家公司:ARM前身为艾康电脑,于1978年在英国剑桥成立。1980年苹果与艾康合作,研究ARM。 1985年研究出ARM1(全球第一款商用RISC架...

    用户5426759
  • Python的循环 博客分类: Python PythonCC++C#

    b里面,x是从a中迭代出来的每一个元素,然后x.get('name')对这个元素进行操作,得到的结果放到list里面,最后循环结束,生成一个列表,则得到的b为...

    chroya
  • 第一章、Go安装与Goland破解

    一直点下一步安装即可,默认是安装在“C:\Go”,如果自己换成其它目录则需添加环境变量。

    zhang_derek

扫码关注云+社区

领取腾讯云代金券