人类第一次发现猫的记录已无从查证,但机器第一次“发现”猫是在5年前的今天。
当是时,谷歌大脑(Google Brain)团队成员Jeff Dean和吴恩达等通过深度学习技术,成功让16000台电脑学习1000万张图片后,在YouTube视频中“认出”了猫。
对于大众而言,这可能是第一次获知深度学习的威力,也是第一次获知谷歌大脑的存在。
不过,即便是该消息报道者,《纽约时报》作家约翰·马尔科夫,或许也难以在美国东部时间2012年6月25日预料到:这个现象及其背后的技术,将如此迅速而深刻地为一个时代的变革拉开序幕。
毫不夸张地说,这可能是人类科技变革史上最狂飙突进的5年,由一只“猫”开始。
那么,谷歌大脑现在什么样了?
成立于2011年的谷歌大脑,目前有正式成员48名,团队负责人是传奇人物Jeff Dean。
在这个团队中,还包括部分供职的泰斗级人物Geoffrey E. Hinton,以及Martín Abadi、Michael Burrows等资深科学家。另外,谷歌首席科学家Vincent Vanhoucke也在谷歌大脑团队中。
那么这些天才的工程师都在研究什么?
如上图所示,谷歌大脑成员的研究范围,主要包括在20大领域。涉及算法和理论、分布式系统和并行计算、机器智能、机器感知等等。不同的成员,涉猎的研究范围也不一样。
量子位在这里就部分领域略做解释。
构成谷歌大脑团队的成员,主要以70后和80后为主,年龄更大和更小的成员,基本算是凤毛麟角。
如上图所示,70后成员达21人,80后成员19人。谷歌大脑负责人Jeff Dean出生于1968年,算是其中年龄非常大的同志了。不过年纪最大的,还得算已经年届70的Geoffrey E. Hinton。
年龄最小的成员应该是Christopher Olah,他也是唯一的90后。而且他应该没有读完本科的课程,2012年拿了Peter Thiel的10万美元的Fellowship半路辍学了。
另外,谷歌大脑团队中的女性成员数量为3人。
谷歌大脑团队成员,90%以上都拥有博士学位。当然其中也有部分成员没有博士学位。
这些博士都来自哪些学校?答案见下图。
斯坦福大学毕业的博士最多。来自加拿大蒙特利尔大学的博士排名第二。来自加州大学伯克利分校的博士排名第三。
根据量子位的统计,这些博士中以Yoshua Bengio为导师的学生最多,全部都毕业自蒙特利尔大学。
另外,Yoshua Bengio的兄弟Samy Bengio也在谷歌大脑团队中。上图左边为Samy右边为Yoshua。
谷歌大脑团队的成员来自全球14个国家。根据量子位不算太严谨的统计,华裔成员排名第二,共计五个人。之所以说不太严谨,是因为诸如美国本土的成员,具体属于什么族群并不太容易进行细分。
可以看到除了华裔之外,来自英国、加拿大、法国等成员也较多。
五位华裔成员,只有Andrew M. Dai本科和博士都毕业于英国。其余的四位,Jianmin Chen本科毕业于北邮,Jie Tan本科毕业于上海交大,Yonghui Wu本科毕业于南京大学,Xiaoqiang Zheng本科毕业于清华。
其中Yonghui Wu目前是谷歌大脑的首席软件工程师。
所有谷歌大脑48名成员中,平均入职谷歌的时间为5.25年。
其中时间最长的Jeff Dean已经加入谷歌18年。大部分成员都是在2007、2010、2012、2013、2015这几年加入谷歌,约占74%。
看起来2015年后,谷歌大脑的扩军速度有所放缓。
除了上面的信息,谷歌大脑成员最近还参与发布了好几篇非常有趣的论文,尤其是部分标题更是一个赛一个的耸动。
贴在这里,有兴趣的同学可以感受一下:
2011年创立:起初只是Google X计划中的项目,由Google Fellow Jeff Dean 、Google研究员Greg Corrado,和当时还在斯坦福任教的教授吴恩达共同发起,他们利用业余时间把深度学习技术带到了人工智能问题的解决中,并建立起了第一代大型深度学习软件系统,DistBelief。
2012年6月“认猫事件”:Google大脑用16000台电脑模拟人类电脑的活动,并在基于1000万张图像学习后,成功在YouTube视频中找出了“猫”——即机器拥有了图像学习和辨识方面的能力。
2013年3月收购DNNResearch:收购DNNResearch 公司,DNNResearch创始人Geoffrey Hinton由此进入Google大脑团队工作,不过他保留在多伦多大学的教职。
插播一句:2014年1月,谷歌收购DeepMind,成为谷歌大脑之外另一个研究人工智能方向的团队。
2015年11月,谷歌大脑团队开发的TensorFlow正式开源发布。目前已经是深度学习领域占据绝对统治地位的框架。
2016年9月谷歌翻译突破:推出神经机器翻译(GNMT),不仅能提升机器翻译的质量,还可以直接实现多语言之间的zero-shot翻译,即可以翻译从未学过的语言。