深鉴科技联合创始人汪玉:针对机器视觉的深度学习处理器(附视频、PPT下载)

本内容选自清华大学电子系副教授、深鉴科技联合创始人汪玉于2018年4月27日在清华大学主楼接待厅数据科学研究院举办的第二届“大数据在清华”高峰论坛所做题为《针对机器视觉的深度学习处理器》的演讲。

视频时长约半个小时,建议使用wifi观看

视频内容

汪玉:大家好,今天给大家汇报一下我们在过去所做的工作。

源自清华 以梦为马

我们团队目前有130个人,有50个清华的同学,覆盖了从软件、架构、芯片、硬件、算法到编译各个环节。今天讲处理器,包括因特尔在内的许多公司不仅仅做架构、做硬件,也有很多在做软件和算法。要让芯片给别人用起来,必须展示出别人能看得见的效果,并且要有很好的编译器。

自主研发 核心技术

给大家介绍一下我们自己的核心技术,讲一讲我们对于这个领域的看法。

说到深度学习,大家说为什么要针对深度学习做一个企业,而不是针对其他方面?深度学习本质上是一个拟合器,用神经网络把参数定下来,给足够多的X、Y做标记,从算法的层面上去支持不同的应用。

从2010年移动互联网普及之后,有标记的数据越来越多。神经网络可以提供方法,把数据利用起来。从CPU到GPU以及专用硬件,我们希望在个人终端领域,包括每个摄像头都可以做这样的网络。

从大的趋势,回顾整个历史阶段,都有一个关键的硬件(图片下方)。我们不知道在AI这个阶段,关键的硬件是什么,所以我们也非常高兴,能看到大家为这样一个核心的能力而去奋斗。

我们的途径是什么?图片下方是最关键的三个部分: DNNDK-软件工具链、指令级、体系结构。

上面给出的是所有算法对应的小模块,它的单元从砖头变成一面墙,所以针对深度学习的前项,有没有可能找到这些抽象的层次,这就是指令级。针对这样的抽象,我们可以满足这些抽象的硬件,需要把所有的神经网络变成指令的集合。由于硬件是固定的,所以只需要支持有限的操作。

对于一个系统,三个东西很重要,第一个是峰值能力,圈了多少个计算单元,多少人在帮你工作。第二个是如何让更高比例的人真正在工作。第三个是做同样的事情,需要的人数能否减少。这三个合起来,才有希望把整体性能提上去。

所有的行业都会拥有Data,训练好一个算法之后,我们可以进行压缩,变成我们所定义的指令的流,并且放在硬件上,形成系统解决方案。

为什么一定要强调软硬件协同?这有一张图,横轴是瓦数。不同的瓦数对应不同的应用领域,希望做的每一个瓦数,对应的性能足够高。

纵轴是性能-每秒计算的次数。图中的三角形表示芯片,能做到大概1T~5T/瓦,这基本是一条很难逾越的线。因此,光做芯片还不够,算法的优化也要做起来。

我们也尝试在做自己的IP。当时做芯片一次可能要投几百万美金,在设计芯片的时候,怎么去适应未来,怎样去把目前所有的网络支持好。你肯定要抽象出中间层次,中间层次的基本单元还要能够拼起来所有的网络,你又不知道未来的网络是怎样的。

在软件方面,我们做的都是神经网络,把不需要的边和点都去掉,就可以降低整体所需要的计算量。不能只是人工去做这些事情,如果你希望赋能所有的行业,我们还需要有一套工具链。用深度压缩工具,可以在CNN和和RNN上获得显著的压缩比,让算法更小、更快、更省功耗。

产品方案及应用

如何应用呢?我举例说明。

这是我们神经网络的加速版,在前端就可以做识别和比对,以后就不用传视频流和图片,传的有可能是特征值。相信在未来几年内,特征值会统一标准。

这是面向语音识别的应用。复杂的音箱对话,都会传到云端去做。我们可以用FPGA做,比CPU和GPU更快,且功耗更低。如果能提高单位功耗对应的计算能力,就可以服务更多的客户。

这是我们尝试在汽车端做的努力,背后由神经网络支撑。一辆车有多个摄像头,会集中到一个平台上做运算,原来可能是用GPU来做,现在我们也提供用FPGA来做。包括前端背后,可能也需要一个预处理的芯片,这个芯片也可以用FPGA来做。

我们更期待,做出来的芯片性能提升,成本下降,以替换已有更高代价的FPGA,以上就是我们在过去学术界做的一些工作,在公司应用和服务的案例,谢谢大家!

注:

张长水-机器学习和图像识别

PPT下载链接: https://pan.baidu.com/s/1D495P0tsg1ZLPAPpIjHUYA 密码: 5cgn

刘知远:知识表示学习及其应用

PPT下载链接:https://pan.baidu.com/s/1t0TI02_a3y4oeC6ACKX2Mg 密码: j927

汪玉:针对机器视觉的深度学习处理器

PPT下载链接: https://pan.baidu.com/s/1o4BoZmLIEZZOBjN8REPWHA 密码: yaka

回顾4月27日第二届“大数据在清华”高峰论坛嘉宾演讲内容:

清华大学张长水:机器学习和图像识别(附视频、PPT下载)

清华大学刘知远:知识表示学习及其应用(附视频、PPT下载)

站立潮头、无问西东 | 第二届“大数据在清华”高峰论坛成功举办

整理:陈龙

校对:西葫芦

为保证发文质量、树立口碑,数据派现设立“错别字基金”,鼓励读者积极纠错。 若您在阅读文章过程中发现任何错误,请在文末留言,经小编确认后,数据派将向检举读者发8.8元红包。 同一位读者指出同一篇文章多处错误,奖金不变。不同读者指出同一处错误,奖励第一位读者。 感谢一直以来您的关注和支持,希望您能够监督数据派产出更加高质的内容。

原文发布于微信公众号 - 数据派THU(DatapiTHU)

原文发表时间:2018-05-22

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏企鹅号快讯

机器学习将走向何方?这里有 5 个关于它未来的预测

机器学习目前是 IT 领域最热门的话题之一,这是因为它在看似无限的应用场景中都能发挥自身的作用。从检测欺诈网站到自动驾驶汽车,再到识别你的“金牌会员”身份以进行...

1948
来自专栏文章翻译

机器学习自学指南

有很多途径来学习机器学习。有丰富的资源:有书籍,有课程可以参与,可以参加比赛,有大量供你使用的工具。在这篇文章中,我想围绕这些活动提出一些你机器学习之旅大致会有...

19910
来自专栏木东居士的专栏

你了解你的数据吗(开篇):总览

2564
来自专栏达观数据

技术分享 | 个性化推荐系统商业化的五大要素

在日前举行的2017 CSDI 中国软件研发管理行业峰会上,包括摩拜单车创始人及CTO夏一平、华为首席系统工程专家徐琦海、京东云、携程等一线互联网企业大数据平台...

42610
来自专栏灯塔大数据

每周学点大数据 | No.2大数据的特点、应用和算法

No.2期 大数据的特点、应用和算法 一、大数据的特点和应用 Mr. 王:大数据具有较大的数据量,和一般的数据相比,其具有如下一些特点。 ? —在数据量上,大...

3444
来自专栏机器之心

微软沈向洋等人长文:从Eliza到小冰,社交对话机器人的机遇和挑战

3988
来自专栏逸鹏说道

携程:机器学习在酒店服务领域的实践

在携程技术中心推出的线上公开课程[携程技术微分享]上,来自携程酒店研发的BI经理潘鹏举,介绍了如何借助大数据和算法,通过机器学习去克服酒店服务行业挑战,给用户带...

3458
来自专栏人工智能

学了这么久机器学习,你真的了解它的概念吗?

引言 我们曾在之前的快讯里提到,Dataversity 最近上线了一个 What is 系列,介绍了数据科学相关的多个概念,之前我们曾介绍了大数据与数据科学(可...

2056
来自专栏大数据挖掘DT机器学习

赛题解说|“达观杯”个性化推荐算法挑战赛技术讲解

达观杯推荐算法大赛开赛将近一个月,获得了大量选手的踊跃参与。为方便大家更好的理解赛题,本次将做一个较为全面的讲解,包括对赛题背景、赛题数据、评分规则等的详细讲解...

3534
来自专栏专知

干货|85页最新《人机对话系统》神经方法综述论文,微软与谷歌研究员联合出品:

【导读】来自微软研究院的 高剑锋, Michel Galley ,以及来自 Google的李力鸿, 最近在ArXiv上发布了关于《人机对话人工智能的神经方法-任...

2932

扫码关注云+社区