助力边缘计算,Arm机器学习处理器来了!

如果能够拥有一部智能个人助理,它能听懂我们说的话并做出智能反应,然后处理日常任务,那感觉一定很棒。鉴于机器学习 (ML) 领域近期取得的进展,Arm相信这一天很快就会到来。机器学习已经远远越过移动市场的边界,延伸到医疗保健、零售、汽车和服务器等领域,从只能识别猫的图片发展到可以解决现实问题的水平。

现在主要的难点是如何将这种能力转移到边缘,解决如今普遍存在的隐私、安全、带宽和延迟问题,Arm 机器学习处理器朝这个方向迈出了一大步。

移动性能

机器学习处理器是专门为移动和相邻市场(例如智能相机、AR/VR、无人机、医疗和消费性电子产品等)推出的全新设计,性能为 4.6 TOP/s,能效为 3 TOPs/W。计算能力和内存的进一步优化大大提高了它们在不同网络中的性能。

其架构包括用于执行卷积层的固定功能引擎以及用于执行非卷积层和实现选定原语和算子的可编程层引擎。网络控制单元管理网络的整体执行和网络的遍历,DMA 负责将数据移入、移出主内存。板载内存可以对重量和特征图进行中央存储,减少流入外部存储器的流量,从而降低功耗。

有了固定功能和可编程引擎,机器学习处理器变得非常强大、高效和灵活,足以应对未来的挑战,不仅保留了原始性能,还具备多功能性,能够有效运行各种神经网络。

主要特点

  • 大幅提升 CPU、GPU、DSP 和加速器效率。
  • 采用开源软件,无锁定。
  • 与现有软件框架紧密集成:TensorFlow、TensorFlow Lite、Caffe、Caffe 2。
  • 经优化后适用于 Arm Cortex CPU 和 Arm Mali GPU。

Arm 机器学习处理器架构

为应对多个市场带来的挑战,满足不同的性能需求,从物联网的每秒几 GOP 到服务器的每秒数十 TOP,机器学习处理器采用了全新的可扩展架构。

对于物联网或嵌入式应用,该架构的性能可降低至约每秒 2 GOP,而对于 ADAS、5G 或服务器型应用,性能可提高至每秒 150 TOP。这些多重配置的效率可达到现有解决方案的数倍。

由于与现有的 Arm CPU、GPU 和其他 IP 兼容,且能提供完整的异构系统,该架构还可通过 TensorFlow、TensorFlow Lite、Caffe 和 Caffe 2 等常用的机器学习框架来获取。

随着机器学习的工作负载不断增大,计算需求将呈现出多种形式。Arm 已经开始采用拥有不同性能和效率等级的增强型 CPU 和 GPU,运行多种机器学习用例。我们推出 Arm 机器学习平台的目的在于扩大选择范围,提供异构环境,满足每种用例的选择和灵活性需求,开发出边缘智能系统。

推荐阅读:

移动和嵌入式设备上也能直接玩机器学习?

一窥ARM的AI处理器

原文发布于微信公众号 - 人人都是极客(rrgeek)

原文发表时间:2018-06-23

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏phodal

我是如何为技术博客设计一个推荐系统(上):统计与评分加权

过去的两周里,我一直忙于为 『玩点什么』 设计一个推荐系统。在这个过程中,参考几本书籍,查找了一系列的资料。想着这些资料上,大部分都是大同小异的,实现了几个简单...

41460
来自专栏SDNLAB

ATT计划推出6万台dNOS支持的白盒设备以实现5G

25360
来自专栏媒矿工厂

Facebook VR方案总结(一)

VR虚拟现实是一种通过创建虚拟世界,使用户沉浸其中的技术,其萌芽于上世纪60年代。但VR第一次走进大家的视野,或许要归功于Facebook。2014年Faceb...

46880
来自专栏深度学习与数据挖掘实战

干货|程序员到机器学习工程师飞跃的实战经验

“我是一名软件开发工程师,阅读过一些关于机器学习方面的书籍和博客文章,也学习过一些在线的关于机器学习的公开课。但是,我仍然不知道怎么应用到工程实践中……”

12220
来自专栏AI研习社

【头条】国外大神的机器学习算法大汇总;如何用50行PyTorch 代码实现GANs

【AI研习社】关注AI前沿、开发技巧及技术教程等方面的内容。欢迎技术开发类文章、视频教程等内容投稿,邮件发送至:zhangxian@leiphone.com ...

37840
来自专栏PPV课数据科学社区

【学习】干货收藏:如何进行大数据分析及处理?

众所周知,大数据已经不简简单单是数据大的事实了,而最重要的现实是对大数据进行分析,只有通过分析才能获取很多智能的,深入的,有价值的信息。 那么越来越多的应用涉及...

88160
来自专栏人工智能快报

Intel Fellow:人工智能与高性能计算将走向融合

作为Intel公司的Fellow,Alan Gara表示随着神经形态计算、量子计算等新型计算、存储、通信技术快速推动百亿亿次计算成为现实,人工智能与高性能计算将...

407110
来自专栏深度学习与数据挖掘实战

程序员到机器学习工程师的飞跃

“我是一名软件开发工程师,阅读过一些关于机器学习方面的书籍和博客文章,也学习过一些在线的关于机器学习的公开课。但是,我仍然不知道怎么应用到工程实践中……”

10820
来自专栏大数据文摘

Elon Musk揭OpenAI研究新突破, 可在VR中自我学习的机器人(附论文)

23350
来自专栏AI科技评论

学界 | OpenAI发布开源软件Roboschool,模拟机器人的控制训练

AI 科技评论消息,OpenAI 今日发布了一个用于模拟机器人的控制训练的开源软件 Roboschool,根据介绍,其整合了前段时间发布的 OpenAI Gym...

386110

扫码关注云+社区

领取腾讯云代金券