前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >助力边缘计算,Arm机器学习处理器来了!

助力边缘计算,Arm机器学习处理器来了!

作者头像
刘盼
发布2018-07-26 15:04:58
1.2K0
发布2018-07-26 15:04:58
举报
文章被收录于专栏:人人都是极客人人都是极客

如果能够拥有一部智能个人助理,它能听懂我们说的话并做出智能反应,然后处理日常任务,那感觉一定很棒。鉴于机器学习 (ML) 领域近期取得的进展,Arm相信这一天很快就会到来。机器学习已经远远越过移动市场的边界,延伸到医疗保健、零售、汽车和服务器等领域,从只能识别猫的图片发展到可以解决现实问题的水平。

现在主要的难点是如何将这种能力转移到边缘,解决如今普遍存在的隐私、安全、带宽和延迟问题,Arm 机器学习处理器朝这个方向迈出了一大步。

移动性能

机器学习处理器是专门为移动和相邻市场(例如智能相机、AR/VR、无人机、医疗和消费性电子产品等)推出的全新设计,性能为 4.6 TOP/s,能效为 3 TOPs/W。计算能力和内存的进一步优化大大提高了它们在不同网络中的性能。

其架构包括用于执行卷积层的固定功能引擎以及用于执行非卷积层和实现选定原语和算子的可编程层引擎。网络控制单元管理网络的整体执行和网络的遍历,DMA 负责将数据移入、移出主内存。板载内存可以对重量和特征图进行中央存储,减少流入外部存储器的流量,从而降低功耗。

有了固定功能和可编程引擎,机器学习处理器变得非常强大、高效和灵活,足以应对未来的挑战,不仅保留了原始性能,还具备多功能性,能够有效运行各种神经网络。

主要特点

  • 大幅提升 CPU、GPU、DSP 和加速器效率。
  • 采用开源软件,无锁定。
  • 与现有软件框架紧密集成:TensorFlow、TensorFlow Lite、Caffe、Caffe 2。
  • 经优化后适用于 Arm Cortex CPU 和 Arm Mali GPU。

Arm 机器学习处理器架构

为应对多个市场带来的挑战,满足不同的性能需求,从物联网的每秒几 GOP 到服务器的每秒数十 TOP,机器学习处理器采用了全新的可扩展架构。

对于物联网或嵌入式应用,该架构的性能可降低至约每秒 2 GOP,而对于 ADAS、5G 或服务器型应用,性能可提高至每秒 150 TOP。这些多重配置的效率可达到现有解决方案的数倍。

由于与现有的 Arm CPU、GPU 和其他 IP 兼容,且能提供完整的异构系统,该架构还可通过 TensorFlow、TensorFlow Lite、Caffe 和 Caffe 2 等常用的机器学习框架来获取。

随着机器学习的工作负载不断增大,计算需求将呈现出多种形式。Arm 已经开始采用拥有不同性能和效率等级的增强型 CPU 和 GPU,运行多种机器学习用例。我们推出 Arm 机器学习平台的目的在于扩大选择范围,提供异构环境,满足每种用例的选择和灵活性需求,开发出边缘智能系统。

推荐阅读:

移动和嵌入式设备上也能直接玩机器学习?

一窥ARM的AI处理器

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-06-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 人人都是极客 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
腾讯云 TI 平台
腾讯云 TI 平台(TencentCloud TI Platform)是基于腾讯先进 AI 能力和多年技术经验,面向开发者、政企提供的全栈式人工智能开发服务平台,致力于打通包含从数据获取、数据处理、算法构建、模型训练、模型评估、模型部署、到 AI 应用开发的产业 + AI 落地全流程链路,帮助用户快速创建和部署 AI 应用,管理全周期 AI 解决方案,从而助力政企单位加速数字化转型并促进 AI 行业生态共建。腾讯云 TI 平台系列产品支持公有云访问、私有化部署以及专属云部署。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档