2019 年 8 月 19 日到 21 日,第 31 届 Hot Chips 大会在斯坦福大学成功举办。
本届 Hot Chips 最大的亮点,毫无疑问是 Cerebras 的 wafer-scale engine (WSE)(史上最大芯片)。通常,一片 wafer (晶圆,生产集成电路所用的载体,多指单晶硅圆片)可以切出几十到上万片不等的芯片,而为了追求极致的性能、最大的片上存储,Cerebras 选择了一条极端的路线,让整片 wafer 就是一片芯片。
AI芯片指专门针对AI算法的专用集成电路,不同于传统的CPU、GPU,后者虽然可以用来执行AI计算,但速度和性能都影响了商用效果。
近年,AI芯片创业风口愈来愈大,创业公司前仆后继。然而高技术含量、高投入、高风险、周期长等特点又让许多创业者在门前折返。而纵观中国的芯片发展史,有这样一批AI芯片创业者迎难而上,披荆斩棘,终于开辟出中国芯片的一片天地。
云知声
从不到十人的创始团队到四百多人的AI公司,从埋头专心打磨核心技术、研发芯片到产品落地一鸣惊人——这一趟旅程,云知声走了七年。
2013年秋天,张军和联合创始人李霄寒开始思考如何在更多场景,比如家居,实现语音交互。
2014年3月,云知声提出“云端芯”战略,领先行业平均2年时间——华为在2016 年才正式提出“云端芯”战略,足见云知声对AI发展的前瞻性已超越了国内绝大多数企业。
2015年8月,智能语音模块(IVM)产品大获成功,一个硬件版可以标准化的对接不同的客户,格力、华帝纷纷上门签单。
但不久后,他们发现了新的问题,板子带芯片成本太高了。于是有人提出,自己造芯片。但大家也都知道芯片高投入周期长,这个决定要慎重。
2015年下半年,团队终于做了决定,造芯片。2016年,这件事情才正式步入了正轨。但团队磨合迎来了最难的时期——算法团队和芯片团队的“互掐”。这是软硬件结合的AI芯片必须经历的阵痛,双方在底线的边缘疯狂相互试探。
如果是通用芯片,成本高企且有比较大的内存和存储空间,但一旦到了AI芯片,特别是边缘侧,多一点点东西都是成本的痛苦,那就希望算法团队配合裁剪。
这个时候算法团队就炸毛了,拍桌子瞪眼睛在办公室是常事,说这个东西我已经做到极致了,而且我很忙。双方争执不下,只能等老大拍板。
在AI芯片的研发过程之中,这是团队在每一个引擎,每一个模块,都会遇到的事情。一个快一个慢,一个讲创造性,一个讲秩序,这两拨人有天然的对抗性。
2018年5月,云知声终于交出了第一代芯片“雨燕”,芯片采用了ARM的架构和自主算法,面向智能家居和智能音箱,在更低成本和功耗下提供更高的算力。2018年8月就吸引了格力和京东等头部客户,并在泛家居领域成为唯一一家实现芯片落地的公司,芯片出货量达到了超400万片。
地平线
2015年,时任百度深度学习研究院副院长的余凯笃定,AI的变量并不在软件,而是处理器架构,底层计算效率和功耗不解决,应用层就会多做很多无用功。于是,他选择了离职创业。
创业团队顺利搭建好了,第一轮融资也轻松完成了,但不知道接下来该去哪里找钱。那时候,没人看得懂余凯到底要做什么,无人愿投资。
从2015年10月,地平线第一个芯片工程师入职,第一行芯片代码敲出,开始做前端开发,经历了写代码,测试代码,画一层一层的物理实现图的过程,再到制造样片,最终在2017年8月16日点亮。同年12月20日,第一代芯片连同基于芯片开发的多个典型应用发布。
其实,一开始芯片团队陷入自我怀疑。但项目真正跑起来之后,团队的信心开始愈发坚定。
2017年底,地平线发布了征程(Journey)1.0处理器和面向智能摄像头的旭日(Sunrise)1.0处理器。余凯把芯片架构比作人的左脑和右脑,负责理性计算还是采用了ARM的架构,负责感性的部分被称为BPU(Brain Processing Unit)——这是地平线自主设计的主要用于人工智能计算的部分。
征程1.0和旭日1.0芯片采用了芯片地平线第一代 BPU架构“高斯”,提出算法来定义芯片,他们赞同计算机先驱、图灵奖得主的理念“真正认真对待软件的人应该做自己的硬件”。
寒武纪
创业之前,陈云霁已经跟随中国“龙芯之父”胡伟武十余年。2008年,陈云霁陈天石兄弟开始联手打造AI芯片,利用各自的科研优势攻关。
2014年3月,陈氏兄弟团队在论文获得国际学术界的认可之后,陈氏兄弟团队的研究工作开始得到更多关注。2015年,团队获得了中科院先导专项数千万元的资助,在这笔资金的支持下,仅20人的研发团队研发出世界首款深度学习专用处理器原型芯片。
陈天石曾说,寒武纪只有小几百人的团队,已经做了很多事情,全球第一款终端AI处理器落地、全球第一款多核终端AI处理器落地、中国第一颗云端人工智能芯片落地、三代终端IP产品发布。
2017年9月初,华为在柏林发布了麒麟970,宣称这是“全球第一枚手机AI芯片”,其中集成了寒武纪1A处理器的IP作为其核心AI处理单元。次年8月,麒麟980同样搭载了寒武纪1A的优化版本。2018年10月11日,华为宣布全面采用自研架构,外界一度解读为华为已经放弃与寒武纪在芯片 IP 层面的合作。
但是10月底搭载麒麟980的华为Mate 20系列手机发布后,寒武纪官方发文《寒武纪1H加持华为麒麟980 带来更强端侧AI算力》,文中表示,继寒武纪1A智能终端处理器助力麒麟970成为全球首款人工智能手机芯片后,寒武纪1H双核处理器继续为麒麟980带来更强大、更卓越、更稳定的移动端AI计算力。用实际行动打消了外界的疑虑。
根据华为官方公布,2018年发布的两款手机,mate20系列的出货量超过了750万台,较早发布的P20系列更是超过1700万台,其中寒武纪1A/1H系列芯片功不可没。
未来中国AI芯片哪位能够成为行业老大,我们拭目以待。
领取专属 10元无门槛券
私享最新 技术干货