首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

深鉴出征HPCA‘18、FPGA’18产品成果引广泛关注

2月24-28日,第24届IEEE高性能计算机体系结构会议(HPCA 2018)在奥地利首都维也纳举行。这是计算机体系结构的国际顶级会议之一,深鉴科技作为本次大会赞助商受邀出席参加并进行产品展示。

与此同时,2月25-27日, FPGA 芯片领域顶级会议也在美国加州Monterey进行着,深鉴科技同样作为合作伙伴受邀出席,并在Panel环节和产品展示区向大家进行最新成果汇报。

国内春节假后第一周,深鉴的研发成员与商务团队兵分两路,行程安排非常紧凑。下面就第一时间跟大家分享此次深鉴出席两场海外顶会的情况记录与感想:

第一站:HPCA'18 奥地利

HPCA(International Symposium on High Performance Computer Architecture)是由IEEE主办的国际会议,每年一次。主要关注高性能计算方面的研究,是体系结构相关领域的顶级学术会议,在国内外学界具有很高的影响力。

图:HPCA大会现场

此次深鉴在会上展示了目前国际领先的CNN处理器架构Aristotle。Aristotle是深鉴自主研发的支持主流深度学习卷积神经网络的实时处理架构,提供了在多平台上已经验证的高效处理能力,针对神经网络算法计算量大、并发度高同时数据吞吐量大的特点,定制化设计了高效的计算阵列和灵活的数据流控制流,同时易于扩展以支持快速演进的算法,实现了加速比和通用性、功耗和性能等的精心优化与平衡。

在会场,深鉴科技展示了基于Aristotle架构研发的车辆行人检测PCIe加速卡, 基于Xilinx Zu9 实现了在16W的低功耗下高达12路的视频流实时处理。同时,深鉴也在会上为观众介绍了Aristotle 架构在前端摄像头的应用,以及即将推出的“Tingtao”系列SoC芯片。深鉴科技芯片团队研发总监方绍峡介绍道:相比传统CPU、GPU,Aristotle架构在能效比方面有一个数量级的提升,除强大的计算核心外,深鉴科技还提供了完整的工具链解决方案DNNDK,可极大简化客户部署CNN应用的工作量。

图:Deephi展位

深鉴此次现场展示的多路高清视频监测Demo引起了与会学者们极大的兴趣,对于观众们普遍关心的性能、功耗以及与GPU/TPU相比的优势等问题,深鉴团队的同事也做了深入的讨论与解答。

在会上我们明显地感受到神经网络加速架构研究作为AI应用的基石,已经成为学术界和工业界的研究热点。本届HPCA神经网络相关研究中,稀疏、微架构优化、新器件、边缘计算等主题受到广泛关注。

论文方面,虽然目前在体系结构领域国内入选的论文还比较少,只占总体数量的10%-15%,但多年以来还是有优秀的学界代表在持续发表,其中UCSB的谢源教授前后共计入选过9篇(1995-2016),并当选了今年HPCA的程序委员会主席。这是华人学者在体系结构体系上地位进步的一个标志。几天的会议中谢源教授也多次来到深鉴展位与大家进行探讨。

图:谢源教授(左三)与深鉴团队

最后深鉴非常感谢主办方给我们这样的机会,能够在体系结构的顶级盛会中与国内外其他优秀的技术公司一起进行交流与学习。这类的会议是从业者获得新思路和深入了解前沿成果的宝贵窗口。

第二站:FPGA'18 美国

伴随近两年国内人工智能硬件/芯片领域的良好发展势头,在FPGA等芯片领域的顶级会议上中国企业和学术代表频频展露实力,深鉴已是第三次参加FPGA,继2017年获得大会最佳论文后,今年深鉴带着产品直接参加成果展示环节与Panel介绍。

本次FPGA从规模上与往年类似,但在今年关于Deep Learning的话题明显有所增加。在会上我们发现,一同参加会议的除了学界代表学者外,还有不少知名业内公司出席,比如Facebook、微软、腾讯等,而且与HPCA稍有不同的是,在FPGA领域的顶会中,华人面孔越来越多,我们认为在Deep Learning带动FPGA发展的背景下,华人实力水平也站在世界前列。

图:大会盛况

现场深鉴的展位是No.1,这几天来参观、咨询交流的同行们非常多。此次展示的产品有两套,分别是edge端的应用:智能网络摄像头,在体积很小的前端摄像头内,加入深鉴独立研发的CNN加速引擎DPU,以极低的功耗(约3W)和低廉的成本价格实现了人脸的快速识别与检测,其识别准确率高,性能卓越稳定。实际可达25FPS的帧率,黑名单/白名单数量高达70000+。

另一款产品Demo是用于云端的物体检测系统,在一块Zu9板卡上实现了高达12路的视频流实时处理,更为重要的是,整板功耗仅为16w,这对于安防监控云服务器和辅助驾驶来说,现阶段是非常优秀的解决方案。

与会嘉宾在展位与我们进行交流时,问到最多的问题是关于“产品能解决什么样的问题,其具体性能如何”等实际落地问题,我们在介绍的过程中也分享了在国内已经开始合作的客户遇到的一些经典案例。在展示的过程中,我们还遇到了直接询问价格及购买方式的与会者,商务同事表示没想到在学术会议上也有意外收获(笑)。

图:深鉴展位

深鉴联合创始人韩松博士在Panel环节演讲了"Bandwidth-Efficient Deep Learning — Challenges and Trade-offs",此次Panel的主题也是围绕Deep Learning, 与会者也表现出对Deep Learning的强烈兴趣,我们在会场上听到和讨论最多的话题也是DL,很荣幸在话题中被提到最多的公司也是深鉴。

图:韩松博士分享

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180302B1B38N00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券