洞见 | 专访中科创达王璠:怎样做好嵌入式人工智能的算法开发?

目前在人工智能领域,不管是学术圈还是工业圈,大家都认同一个趋势,那就是在很多应用场景上计算需要落地到设备上,让设备拥有智能化——即嵌入式的AI,这个是人工智能领域新开辟出的一个分支。

中科创达技术总监王璠坚定的对AI科技评论说。

在近日(4月28日)的北京GMIC大会新技术演示Show上,王璠向外界展示了中科创达在嵌入式人工智能方面所做的工作。这位百度出身的90后的技术总监,目前带领着一支30人的 ThunderView 技术团队专注于嵌入式AI的算法研究。我们现在做的工作是将深度学习放在嵌入式设备上,王璠进一步解释道。

↑ 王璠

那么什么是嵌入式 AI 呢?

据AI科技评论了解,所谓嵌入式AI,就是设备无须联网通过云端数据中心进行大规模计算去实现人工智能,而是在本地计算,在不联网的情况下就可以做实时的环境感知、人机交互、决策控制。

谈及嵌入式AI和云端计算的AI的区别,王璠告诉AI科技评论,对于一般的AI系统,数据可以在服务器端进行计算,人们往往会通过增加模型的大小、网络的深度,调用尽可能多的计算资源,以期得到更加精确的计算结果。而对于嵌入式AI来说,就需要反其道而行之了,王璠总结道,云端计算的AI致力于如何更好的解决问题,而嵌入式的AI则致力于如何更加经济的解决问题。

嵌入式AI的应用场景有哪些?

对于嵌入式AI的应用场景,王璠表示,云端计算虽然精确度高,但并不是所有的场景都适合,比如:

  • 辅助驾驶或者自动驾驶系统,如果在云端计算,设备端采集到数据后上传,计算完成后再返回终端,这样会不可避免的带来一定的延时,而在驾驶的场景中,这种延时意味着危险系数的提高。
  • 数据安全,比如家里安装了一个监控摄像头,用来关注老人和孩子的安全,上传到云端的计算也意味着隐私被泄露的风险提升。
  • 脱机,虽然现在通信技术发展的很快,但是仍然会碰到在地下停车场、商场里没有信号的情况,这时候就不能指望云端计算有很好的用户体验了。

所以,嵌入式的人工智能还是有很大的市场需求的。

同样是做嵌入式的人工智能,地平线CEO余凯曾经说过,嵌入式AI的应用场景地平线看好三个方向:安防、智能家庭、智能驾驶。对此,王璠也表示赞同,同时表示这三个方向在实现难度上也是逐渐递增的。

从算法方面来看,目前ThunderView算法解决方案包括深度学习算法、算法优化、算法集成三个部分。王璠提到,深度学习算法和算法优化这两个部分在执行过程中是高度耦合在一起的,同时算法优化部分的工作非常重要,难度也最大。目前他们已经在图像处理、机器视觉等领域取得了一些成果,王璠告诉AI科技评论:

在2017年的国际消费类电子产品展览会(CES)及世界移动通信大会(MWC)上,我们团队携手高通公司在高通展台上展示了我们的物体识别及智能拍照引导算法。这些算法独立运行在高通的便携设备上,支持单机运行,不需要联网。实时识别物体,实时对用户的拍照行为进行引导。 也是在今年的MWC上,我们联合ARM公司在ARM展台展示了食品识别及热量估算的算法。利用在ARM设备上的深度学习引擎,我们在ARM双摄设备上展示了食品识别和热量估算的移动应用程序。

↑ MWC2017高通展台展示的ThunderView 算法技术

因为对于深度学习的网络模型而言,如果一个应用场景优化的比较好的话,是可以将其适配到不同的任务中的。所以目前我们的选择是先把基本场景做好,然后再将技术推广至不同的领域。比如现在和高通的合作是在检测方面,和ARM的合作是在分割和识别方面,而我们的目标是要在每一个领域至少做到业界 state of the art 的水平,王璠信心满满的告诉AI科技评论。

那么如何更加经济的用嵌入式AI解决问题呢?

王璠表示,嵌入式设备的计算资源有限,虽然移动芯片的计算能力突飞猛进,拿现在能力最强的高通骁龙835为例,它的单精浮点运算性能为630GFLOPS,比起2000年前后的超算,已经可以进入前100了。但是比起现在PC端的Tesla P100,其单精浮点运算性能可达10TFLOPS,仍有十几倍的差距。这就意味着嵌入式AI和PC端的玩法将完全不同。

一般来说嵌入式的开发层级从上到下可以分为:应用层(Application),算法层(AI Algorithms),操作系统层(OS),驱动层以及芯片层。由于移动芯片计算能力的限制,嵌入式人工智能除了需要优化算法层之外,还需要关注底层驱动和操作系统的优化——这就需要算法团队不仅在操作系统领域里经验丰富,还需要和芯片厂商有紧密的合作。

同时,对于嵌入式,用户对功耗和发热等性能要求又极为敏感。所以王璠表示,综合这些因素后,现阶段我们做嵌入式的计算必须要有高效、经济的算法。而要达到这个目标,则需要从硬件和软件两方面着手。

硬件

对于中科创达,硬件是基于高通、ARM这些厂商的芯片。不仅如此,王璠提到,他们在技术层面的合作已非常深入,目前的合作方式为硬件厂商开发加速引擎,并将芯片提前提供给中科创达算法团队来开发技术,这个过程中硬件厂商会基于算法团队提出的一些意见来改进引擎。王璠举了个例子,中科创达在MWC2017上和高通合作系统,高通在硬件优化上面提供了很大的帮助,他们内部开发了一个完全针对与深度学习算法的加速引擎,使运算获得了5倍左右速度的提升。一个好的引擎,可以让AI系统落地到嵌入式设备上取得事半功倍的效果。

软件

软件方面则需要更加经济的计算模型,在保证准确率的前提下,尽量减少计算量。

首先是一个经济的网络设计。

用深度学习的方法来处理AI,很多时候是一个搭积木的过程。随着现在人工智能方面开源的程度越来越大,从网上能得到的公开资源诸如文章、网络结构、评测、训练好的模型等等都很多,善用这些资源,把各模块嵌到网络里面,达到既满足你当前的需求,又具有更好效果的网络。

第二,从繁入简。传统的AI的算法,都是在一个很庞大的集群来运行的。在这种情况下,网络的大小可能到几百兆,甚至几个G,速度也比较慢。假如要放到嵌入式上,就需要从繁入简。这里有两个方法:

  • 一个是老师-学生模型,设计一个小网络,从原有的复杂网络里面学习它的知识。典型的方案是 Hinton 提出的模型蒸馏,包括现在很多的半监督学习也会用类似的方式来做。这是特别有效的缩减网络规模的方式。
  • 另外一点就是裁减和近似。这里的关键在于缩减之后,很可能会降低性能,这时就需要算法工程师需要做出平衡和取舍了,什么样的程度才可以在满足当前需求的同时达到最佳的效果。

第三点,适用场景。对于不同的任务场景,最优的网络设计是不一样的。尤其在嵌入式上,需要尽可能的让运行速度更快。测试集和用户实际使用场景是不一样的,所以在模型设计好后还需要根据用户可能碰到的实际情况做适配。

↑ MWC2017ARM展台展示的ThunderView 算法技术

第四点是共享参数。尽可能的用同一套参数来完成多种不同的任务。比如在MWC上,创达和ARM联合做的一个技术,主要是做食物的识别和卡路里的计算。我们需要完成的任务,降到算法层级来说,需要第一知道是什么食物,第二要知道这个食物在哪里,轮廓是多大,知道体积后才能估计它有多少卡路里。在做食物分类的时候,在深度学习的参数内部已经包含了很多关于这个食物的信息。当最后把分割任务加进去的时候,实际上并没有浪费任何一个多余的参数,只是最后抽出来一些特征,做一个简单的拟合,就可以得到一个比较好的效果。

最后,王璠总结道,要想嵌入式人工智能玩得好,必须做到软硬件的充分结合。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-05-04

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技评论

从数据算法到人工智能,带你穿越重重迷雾 | AI科技评论周刊

在通向人工智能的道路上,免不了要经常和数据算法打交道。本周AI科技评论从专业角度,详解最新出炉的科学家最常使用的十大算法,以及分析深度学习在数据革命中到底占据什...

3415
来自专栏AI科技大本营的专栏

深度学习2016年度回顾:三大技术和三大趋势

---- 作者:简·布斯尔克(Jan Bussieck) 编译: AI100 原文地址: http://www.deeplearningweekly.com/b...

30910
来自专栏数据派THU

8个带你快速入门的趣味机器学习项目(附数据源、教程)

来源:机械鸡(ID:jixieji2017) 本文长度为3216字,建议阅读6分钟 本文为你介绍八个短时间可以完成的趣味机器学习项目。 抽时间做项目是最好的一种...

20710
来自专栏人工智能快报

美NSF发布“计算神经科学协作研究”项目指南

美国国家科学基金会(NSF)发布“计算神经科学协作研究(CRCNS)”项目指南,支持如下两类研究——跨科学学科的创新合作研究,以及数据、软件与其他资源共享研究。...

3447
来自专栏PPV课数据科学社区

【探讨】为什么数据分析师要用产品思维?

数据分析这词汇时髦的不得了,然而就像这些年所炒的各种概念一样,当冷静下来,请很多人解释数据分析到底是什么时,恐怕要有一个不错的答案很难。   比较常...

3375
来自专栏人工智能快报

通往未来人工智能的三条途径:量子计算、神经形态计算和超级计算

美国“数据科学中心”(Data Science Central)网站的编辑总监William Vorhies撰文表示,量子计算、神经形态计算和超级计算可以带来更...

3239
来自专栏IT派

“死亡算法”:预测死亡时间准确率达90%!

导读:在2017年11月的IEEE国际生物信息学与生物医学大会上,斯坦福大学计算机科学系的一名研究生Anand Avati对“死亡算法”的研究进行了报告:预测死...

3265
来自专栏量子位

快手AI技术副总裁郑文:为什么说AI是短视频平台的核心能力

7月初举办的中国软件研发管理行业峰会(CSDI)上,快手AI技术副总裁郑文针对AI技术在短视频领域的应用做了精彩演讲。他介绍了人工智能技术是如何在快手整个业务流...

760
来自专栏DT数据侠

邬学宁:未来30年人工智能将影响人类命运

上海2018年“创客中国”高峰论坛上,数据科学50人成员、SAP硅谷创新中心首席数据科学家邬学宁以“大数据驱动人工智能的应用和展望”为主题发表了演讲。随着物联网...

600
来自专栏数据科学与人工智能

【数据科学】如何区分大数据下的三大利器:数据科学家,数据工程师与数据分析师。

与其他一些相关工程职位一样,数据科学家的影响力与互联网同进同退。数据工程师和数据分析师与数据科学家携手共同完成这幅“大数据时代”巨作。他们共同努力拟定数据平台要...

2369

扫描关注云+社区