前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >2018 Future Chips之旅

2018 Future Chips之旅

作者头像
用户1148523
发布2019-05-26 14:17:40
2760
发布2019-05-26 14:17:40
举报
文章被收录于专栏:FishFish

Introduction

今年future chips首页

http://www.icfc.tsinghua.edu.cn/futurechips2018/index.html

主办单位:清华大学

今年的主题是:

Reconfigurable computing in a new golden age 可重构计算的黄金时代

邀请了很多学术界和工业界大牛来讨论前沿话题,重点就是可重构计算以及应用。

12.9

是个workshop,主题是内存计算(computing-in-memory)和基于机器学习的硬件加速技术。请了一些大牛在一间小教室里以讲座和座谈的形式进行。大概形式如图所示。

workshop
workshop

Computing-In-Memory

也就是内存计算,这是对现有冯诺依曼架构的一种颠覆。传统的冯诺依曼架构运算器和存储器是分开的,而内存计算打破了运算器和存储器的界限,将一部分运算单元和存储单元融合到了一起。为什么需要这种架构呢,因为随着计算的并行度在不断上升,所需数据的传输带宽限制了运算速度,史称冯诺依曼瓶颈,并且随着摩尔定律的发展,计算单元的功耗越来越多,所以花在存储器读写上的功耗越来越高,使得存储成为计算的主要瓶颈。

而非冯架构的出现,就是为了克服这些问题,只要将数据放进存储器里,再拿出来的时候就是已经计算好的数据,这样既可以解决数据传输问题又可以解决功耗问题。

然后各个演讲者针对内存计算提出了很多自己的成果和想法,包括新的NVM原件的使用效果和优化,还有Benchmark的开发等等内容

12.10

10,11这两天是正式的会议,主题是可重构计算。

可重构计算

到底什么是可重构计算呢,简单来说就是硬件能够根据不同的APP自己配置架构。可重构计算也是和神经网络一样,是一个提出了很久但是最近刚火的概念。为什么可重构计算在提出的时候没有受到重视而现在开始兴起,因为它刚提出来的时候,正是摩尔定律最火热的时候,人们发现工艺的更新远比修改架构带来的性能提升多,花很久研究可重构芯片还不如坐等摩尔定律增长带来的性能提升,所以当时关于可重构计算概念只是大部分出现在学术界。

但是,摩尔定律要凉了呀,并且随着现在五花八门的计算任务层出不穷,而CPU又不是对于所有的计算任务都最好的处理器,人们就开始慢慢关注起来优化架构能够给计算带来的性能提升了。这就是可重构计算开始火起来的原因。

下图给以可重构计算的以直观概念,在可重构处理器上,有很多小的PE,这些PE可能是具有不同功能的小核心,它们之间有一定的数据通路保证能够进行数据交换。然后上层编译器或者硬件单元,通过对于上层应用的分析,包括任务类型,资源使用,功耗等的分析,将不同的PE通过数据通路链接成一个大的处理器。这就是根据上层应用的特征所单独定制的处理器,就会比任何通用处理器处理这个特定的应用要快很多。

可重构处理器
可重构处理器

现阶段各种处理器的比较

现有的一些处理器的各种能力的分类:

不同处理器雷达图
不同处理器雷达图

可以看到,每一种处理器都有各自的优缺点,而可重构计算的目标就是八边形战士:

可重构的目标
可重构的目标

无论是性能,可扩展性,可重构性,自定义性,能效比,灵活性还是易用性等都很好。

高级综合

有了底层架构的可重构性, 硬件条件有了,下一步就是开发者编程了。想要写出适合底层硬件使用的代码,可能越接近底层的代码效率越高,但是越接近底层也就越复杂,学习和开发的周期就越长。所以高级综合的作用就显现了。这就是编译器需要做的事情,针对底层可重构的硬件架构,将上层开发者写的C语言等高级语言,变成更接近底层架构的中间语言。通过高级综合生成的代码,可能在效率上还是和一个成熟的开发者写的底层代码有一定差距,但是这能够大大降低开发的难度,减少开发周期。而且,现在关于许多关于高级综合的研究,就是为了提高这种转换生成的代码的效率。

SDH

Sofrware Defined Hardware.软件定义硬件,也就是说,根据软件的需求来修改硬件的架构。期间有个Panel就是讨论,软件定义硬件到底是革命(revolution)还是改革(evolution),但是实际上大家都知道的道理是计算机就是折中(trade-off)的艺术,所以参与者的回答也是折中的,比如下图

变革还是革命
变革还是革命

明显能感觉到,在这波人工智能浪潮到来之前,硬件是基本上不会刻意去迎合特定的上层应用的,其实从NVIDIA的GPU体系结构就能看出来,在GPU刚刚问世时候,称之为通用图形计算单元(当然现在我们也这么叫),但是随着架构的演变,里面越来越多的针对深度学习神经网络的优化,tensor core、半精度浮点数、针对矩阵乘的各种深度优化等等。人们对于软件的需求开始逐渐影响计算机体系结构,所以体系结构也开始追求不那么general的东西来迎合上层应用。

12.11

这天上午的主要内容是相关的深度学习应用,还是很直观且有趣的

器官划分

就是使用CNN之类的算法,在CT或者X光片上把人体的各个器官划分出来。

智能零售

speaker针对智能零售做了以下分类,循序渐进的智能化。

智能零售
智能零售

机器人

中科院开发的国产机器人DADU

硬件开源

第二天的panel讨论的话题是硬件开源。不过气氛好像比第一天的有些紧张。panel邀请了工业界和学术界的参与者,工业界的代表对于开源并不看好,毕竟开源会对一些已经占领市场的硬件厂商造成不利的影响;但是学术界当然希望能够开源,而且从软件开源上也能证明,开源也能够促进行业发展,比如大数据时代的利器Spark和Hadoop就是开源产品,这两者也不负众望地极大助推了大数据时代的发展。

启发

机器学习背景下的体系结构

有一个speaker是利用机器学习算法来指导电路设计。让我想到,利用机器学习或者深度神经网络来指导计算机体系结构的优化也肯定是可以的。比如对于探索空间很大的问题,可能会有很多很多种组合的输入等待算法来找到解,通常的做法往往是通过剪枝保留一部分可能的输入,再输入到模型中获得最优或者次优解。剪枝又有很多局限性和考虑,但是如果采用深度学习的策略,通过一系列的训练,可能不需要了解数据之间的关系,就能够直接找到一个合适的模型,也不需要剪枝,直接将数据送入神经网络中,就能够得到比较好的结果。

或者,还有其他的什么用处,感觉深度学习这东西就是用来偷懒的,以前需要你自己分析自己找特征,现在扔进去,拿出来,特征自动给你找好了,当然付出的代价也是巨大的,那就是无法证明你的这套东西的逻辑正确科技正确,因为神经网络是个黑盒,搞不懂里面的原理,你的算法就稀里糊涂,如果你是个“实用主义科学家”,那能用就行啦,不过科研还是要讲究逻辑讲究推理讲究能够用现有的知识明确推理出结论,深度学习神经网络这种还没有彻底搞清楚原理的东西,拿来做应用没什么问题,但是拿来构建科学的大厦,还是有待商榷的吧。

搞科研的步骤

有一个speaker讲了他们组关于可重构架构的一套工具链,包括编译器,prof工具等。他的工具链的每一个部分都是发表在某个会议。重点是这些文章并不是一步到位地发表在我们所谓的顶会上(当然也不太差,不是date就是dac),这个工具链通过一步步地积累,逐渐成熟之后,有了更加广泛的用途也有了更好的成果,这种成果不仅仅是作为论文发表在顶会这一项,而是能够真正地运用到实际的科研当中。

自己现在在实验室做research,虽然对自己分析问题还有解决问题的能力有很大地锻炼,但是对于整个实验室科研情况的观察来看,总感觉缺乏一种大方向的指引。每个人虽然有自己的idea,也在为自己的idea做实验看paper,但是每个人的idea好像都是独立的,很少能够从别人的research中借鉴到一些基础的共通的东西。原因有很多吧,实验室的人力,未知方向的探索以及对学生的培养方式等等。

对于自己的科研探索也是一种启发,虽然现在的自己刚接触科研,眼界还很窄,而且在实验的过程中也总会发现自己过于关注细节之后,就对于整体的了解变得很片面。做科研,既要仰望星空也要脚踏实地,不仅要对每一个算法的每一行实现都能够准确无误,也要时长对于论文idea乃至以后科研的方向有个总体的认识。时而思考抽象而庞大的东西,才能跳脱出一行行代码的限制,找到问题的解决方向。

Reference

[1]不以非冯为目的AI存储器都是耍流氓?

[2]大数据时代来临,可重构计算复兴

[3]Future computer Architectures: Computing in Memory

[4]2017 Future Chips之旅

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2018年12月21日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Introduction
  • 12.9
    • Computing-In-Memory
    • 12.10
      • 可重构计算
        • 现阶段各种处理器的比较
          • 高级综合
            • SDH
            • 12.11
              • 器官划分
                • 智能零售
                  • 机器人
                    • 硬件开源
                    • 启发
                      • 机器学习背景下的体系结构
                        • 搞科研的步骤
                        • Reference
                        领券
                        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档