专栏首页数据派THU深鉴科技联合创始人汪玉:针对机器视觉的深度学习处理器(附视频、PPT下载)

深鉴科技联合创始人汪玉:针对机器视觉的深度学习处理器(附视频、PPT下载)

本内容选自清华大学电子系副教授、深鉴科技联合创始人汪玉于2018年4月27日在清华大学主楼接待厅数据科学研究院举办的第二届“大数据在清华”高峰论坛所做题为《针对机器视觉的深度学习处理器》的演讲。

视频时长约半个小时,建议使用wifi观看

视频内容

汪玉:大家好,今天给大家汇报一下我们在过去所做的工作。

源自清华 以梦为马

我们团队目前有130个人,有50个清华的同学,覆盖了从软件、架构、芯片、硬件、算法到编译各个环节。今天讲处理器,包括因特尔在内的许多公司不仅仅做架构、做硬件,也有很多在做软件和算法。要让芯片给别人用起来,必须展示出别人能看得见的效果,并且要有很好的编译器。

自主研发 核心技术

给大家介绍一下我们自己的核心技术,讲一讲我们对于这个领域的看法。

说到深度学习,大家说为什么要针对深度学习做一个企业,而不是针对其他方面?深度学习本质上是一个拟合器,用神经网络把参数定下来,给足够多的X、Y做标记,从算法的层面上去支持不同的应用。

从2010年移动互联网普及之后,有标记的数据越来越多。神经网络可以提供方法,把数据利用起来。从CPU到GPU以及专用硬件,我们希望在个人终端领域,包括每个摄像头都可以做这样的网络。

从大的趋势,回顾整个历史阶段,都有一个关键的硬件(图片下方)。我们不知道在AI这个阶段,关键的硬件是什么,所以我们也非常高兴,能看到大家为这样一个核心的能力而去奋斗。

我们的途径是什么?图片下方是最关键的三个部分: DNNDK-软件工具链、指令级、体系结构。

上面给出的是所有算法对应的小模块,它的单元从砖头变成一面墙,所以针对深度学习的前项,有没有可能找到这些抽象的层次,这就是指令级。针对这样的抽象,我们可以满足这些抽象的硬件,需要把所有的神经网络变成指令的集合。由于硬件是固定的,所以只需要支持有限的操作。

对于一个系统,三个东西很重要,第一个是峰值能力,圈了多少个计算单元,多少人在帮你工作。第二个是如何让更高比例的人真正在工作。第三个是做同样的事情,需要的人数能否减少。这三个合起来,才有希望把整体性能提上去。

所有的行业都会拥有Data,训练好一个算法之后,我们可以进行压缩,变成我们所定义的指令的流,并且放在硬件上,形成系统解决方案。

为什么一定要强调软硬件协同?这有一张图,横轴是瓦数。不同的瓦数对应不同的应用领域,希望做的每一个瓦数,对应的性能足够高。

纵轴是性能-每秒计算的次数。图中的三角形表示芯片,能做到大概1T~5T/瓦,这基本是一条很难逾越的线。因此,光做芯片还不够,算法的优化也要做起来。

我们也尝试在做自己的IP。当时做芯片一次可能要投几百万美金,在设计芯片的时候,怎么去适应未来,怎样去把目前所有的网络支持好。你肯定要抽象出中间层次,中间层次的基本单元还要能够拼起来所有的网络,你又不知道未来的网络是怎样的。

在软件方面,我们做的都是神经网络,把不需要的边和点都去掉,就可以降低整体所需要的计算量。不能只是人工去做这些事情,如果你希望赋能所有的行业,我们还需要有一套工具链。用深度压缩工具,可以在CNN和和RNN上获得显著的压缩比,让算法更小、更快、更省功耗。

产品方案及应用

如何应用呢?我举例说明。

这是我们神经网络的加速版,在前端就可以做识别和比对,以后就不用传视频流和图片,传的有可能是特征值。相信在未来几年内,特征值会统一标准。

这是面向语音识别的应用。复杂的音箱对话,都会传到云端去做。我们可以用FPGA做,比CPU和GPU更快,且功耗更低。如果能提高单位功耗对应的计算能力,就可以服务更多的客户。

这是我们尝试在汽车端做的努力,背后由神经网络支撑。一辆车有多个摄像头,会集中到一个平台上做运算,原来可能是用GPU来做,现在我们也提供用FPGA来做。包括前端背后,可能也需要一个预处理的芯片,这个芯片也可以用FPGA来做。

我们更期待,做出来的芯片性能提升,成本下降,以替换已有更高代价的FPGA,以上就是我们在过去学术界做的一些工作,在公司应用和服务的案例,谢谢大家!

注:

张长水-机器学习和图像识别

PPT下载链接: https://pan.baidu.com/s/1D495P0tsg1ZLPAPpIjHUYA 密码: 5cgn

刘知远:知识表示学习及其应用

PPT下载链接:https://pan.baidu.com/s/1t0TI02_a3y4oeC6ACKX2Mg 密码: j927

汪玉:针对机器视觉的深度学习处理器

PPT下载链接: https://pan.baidu.com/s/1o4BoZmLIEZZOBjN8REPWHA 密码: yaka

回顾4月27日第二届“大数据在清华”高峰论坛嘉宾演讲内容:

清华大学张长水:机器学习和图像识别(附视频、PPT下载)

清华大学刘知远:知识表示学习及其应用(附视频、PPT下载)

站立潮头、无问西东 | 第二届“大数据在清华”高峰论坛成功举办

整理:陈龙

校对:西葫芦

为保证发文质量、树立口碑,数据派现设立“错别字基金”,鼓励读者积极纠错。 若您在阅读文章过程中发现任何错误,请在文末留言,经小编确认后,数据派将向检举读者发8.8元红包。 同一位读者指出同一篇文章多处错误,奖金不变。不同读者指出同一处错误,奖励第一位读者。 感谢一直以来您的关注和支持,希望您能够监督数据派产出更加高质的内容。

本文分享自微信公众号 - 数据派THU(DatapiTHU),作者:汪玉

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-05-22

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 独家 | 一文读懂优化算法

    一、前言 模拟退火、遗传算法、禁忌搜索、神经网络等在解决全局最优解的问题上有着独到的优点,其中共同特点就是模拟了自然过程。模拟退火思路源于物理学中固体物质的退火...

    数据派THU
  • 一文读懂神经网络(附PPT、视频)

    本文共6500字,建议阅读10分钟。 本文从神经网络的发展历史出发,为你介绍感知器模型、前馈神经网络及BP算法。 [导读] 提起神经网络,你会想到什么?关于深度...

    数据派THU
  • 原创 | 初学者友好!最全算法学习资源汇总(附链接)

    在计算机发展飞速的今天,也许有人会问,“今天计算机这么快,算法还重要吗?”其实永远不会有太快的计算机,因为我们总会想出新的应用。虽然在摩尔定律的作用下,计算机的...

    数据派THU
  • 企业竞相布局人工智能

    如今,很多大公司都会利用神经网络来完成一些模拟人类思维的任务。 最初实现的任务是语音识别,但是现在IBM的超级电脑沃森(Watson)及其他各种各样的神经网络正...

    人工智能快报
  • jquery中动态新增的元素节点无法触发事件解决办法

      在使用jquery中动态新增的元素节点时会发现添加的事件是无法触发的,我们下面就为各位来详细的介绍此问题的解决办法.

    超然
  • 主流的深度学习模型有哪些?

    作者:阿萨姆 | 普华永道 数据科学家 量子位 已获授权编辑发布 转载请联系原作者 深度学习大热以后各种模型层出不穷,很多朋友都在问到底什么是DNN、CNN和R...

    量子位
  • Java自学之道(二) Java开发环境准备

    Java自学之道(二) Java开发环境准备   这里主要讲JDK的配置,JDK的安装和安装一般的应用软件一样,下载JDK 安装就可以了,但安装后主要是配置好...

    闵开慧
  • 面向机器学习专业人员的开源文本注释工具Doccano

    Doccano是面向机器学习专业人员的开源文本注释工具。它为序列标签,文本分类和序列任务设置注释功能。它具有多种应用程序,例如创建用于情感分析的标记数据,命名实...

    代码医生工作室
  • 老司机带你走进Core Animation 之粒子发射、TileLayer与异步绘制

    老司机带你走进Core Animation 之粒子发射、TileLayer与异步绘制

    老司机Wicky
  • C语言最基础的东西你知道吗?C语言基础教学档案!

    本节用于提供程序的小描述。注释行只是被编译器忽略,这意味着它们不会被执行。在C中,有两种类型的注释。

    诸葛青云

扫码关注云+社区

领取腾讯云代金券