专栏首页ATYUN订阅号【业界】手机芯片霸主ARM革新了机器学习和神经网络的新功能

【业界】手机芯片霸主ARM革新了机器学习和神经网络的新功能

剑桥科技巨头Arm公司已经推出了Project Trillium——一套Arm IP,包括新的高度可扩展的处理器,以提供增强的机器学习(ML)和神经网络(NN)功能。

Arm公司是专门从事基于RISC 技术芯片设计开发的公司,同时也是全球领先的半导体知识产权 (IP) 提供商,并因此在数字电子产品的开发中处于核心地位。

目前的技术主要集中在移动市场上,并将启用具有先进计算能力的新型ML设备,包括最先进的对象检测。

现在的ML技术倾向于关注特定的设备类或个别行业的需求。Arm的Project Trillium通过提供最终的可扩展性来改变这一点。

虽然最初的发布集中在移动处理器上,但未来Arm ML的产品将提供提升或降低性能曲线的能力——从传感器、智能扬声器到移动、家庭娱乐以及其他领域。

该公司总裁Rene Haas透露:“人工智能在边缘设备上的快速加速,增加了对创新的需求,以便在保持节能效果的同时解决计算问题。”

为了满足这一需求,Arm宣布推出其新的ML平台项目Trillium。新设备将需要这些新处理器提供高性能ML和AI功能。

“结合我们平台提供的高度灵活性和可扩展性,我们的合作伙伴可以跨越各种设备的边界。”

Arm的新ML和对象检测处理器不仅提供了独立CPU、GPU和加速器的巨大效率提升,而且远远超过了传统的DSP的可编程逻辑。

Arm ML处理器是从底层开始构建的,专门用于ML。它基于高度可扩展的Arm ML架构,并达到了ML应用程序的最高性能和效率:

—对于移动计算,该处理器每秒传输超过4.6万亿次运算

—(TOPs)通过智能数据管理,在实际应用中进一步提高了2x-4x的有效吞吐量

—在热量和成本约束的环境中,具有无与伦比的性能,运行效率超过每秒3万亿次(TOPs/W)

Arm OD处理器是专门为有效地识别人和其他对象而设计,每一帧的对象实际上都是无限的:

—以每秒60帧的全高清处理实时检测

—传统DSP的性能达到80倍,相对于以往的Arm技术,检测质量有了显著提高

综合来看,Arm ML和OD处理器性能更好,可提供高性能、高功效的人员检测和识别解决方案。用户可以通过电池友好的方式在智能设备上享受高分辨率、实时、详细的人脸识别功能。

Arm NN软件与Arm Compute Library和CMSIS-NN一起使用时,针对NN进行了优化,弥补了NN框架(如TensorFlow,Caffe和Android NN)以及各种ArmCortex®CPU,Arm Mali™GPU和ML处理器。

开发人员能够充分利用底层ARM硬件功能和性能,从ML应用程序中获得最高性能。

Arm ML IP的新套件将于4月份提供早期预览版,并将于2018年中期全面上市。

本文分享自微信公众号 - ATYUN订阅号(atyun_com)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-02-26

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 苹果整合机器学习和Siri团队,由John Giannandrea领导

    苹果正在创建一个新的AI和ML团队,将其核心ML和Siri团队整合到负责人John Giannandrea之下。

    AiTechYun
  • 通过实例说明机器学习如何处理歧义

    在机器学习和人工智能的世界中,遇到的每个独特的现实世界问题都有其自身的影响和危险。尽管采用了所有有效的技术,但有时很难取代诸如“不确定性”的简单因素。例如,在图...

    AiTechYun
  • 【实践操作】 在iOS11中使用Core ML 和TensorFlow对手势进行智能识别

    在计算机科学中,手势识别是通过数学算法来识别人类手势的一个议题。用户可以使用简单的手势来控制或与设备交互,让计算机理解人类的行为。 这篇文章将带领你实现在你自己...

    AiTechYun
  • iOS源码分析(1)——RunLoop

    NSRunLoop 是基于 CFRunLoopRef 的OC封装,提供了面向对象的 API,但不是线程安全的,CFRunLoopRef 是在 CoreFound...

    羊羽shine
  • volatile和synchronized的区别和联系

    volatile 它所修饰的变量不保留拷贝,直接访问主内存中的。    在Java内存模型中,有main memory,每个线程也有自己的memory (例如寄...

    xiangzhihong
  • android Handler机制之ThreadLocal详解

    概述 我们在谈Handler机制的时候,其实也就是谈Handler、Message、Looper、MessageQueue之间的关系,对于其工作原理我们不做详解...

    xiangzhihong
  • 深入理解ThreadLocal

    在每个线程Thread内部有一个ThreadLocalMap,这是用来存储实际的变量副本的,键值key为当前ThreadLocal变量,value为变量副本。初...

    java达人
  • 重新认识ThreadLocal

    ThreadLocal 是一个线程内部的数据存储类,通过它可以在 指定的线程中 存储数据,数据存储以后,只有在指定线程中可以获取到存储的数据,对于其他线程来说则...

    蜻蜓队长
  • Bash脚本编程之subshell

    (command1;command2;command3;...)会启动子shell。子shell可以访问父shell的变量,对父shell变量的改动只在子she...

    枇杷李子橙橘柚
  • C#多线程学习一

    一、概述:C#支持多线程并行执行程序,一个线程有他单独的执行路径,能够与其他线程同时执行,一个程序是由一个单线程开始,该单线程由CLR(公共语言运行时)和操作系...

    郑小超.

扫码关注云+社区

领取腾讯云代金券

玩转腾讯云 有奖征文活动