深度 | 对话英特尔中研院宋继强:英特尔 AI 加持春哥最新 MV 的背后

AI科技评论按:如果没有2005年的爆红,这些数以万计的陌生人或许就不会站在雨里,为台上的偶像李宇春“打 call”,而李宇春也不会在走红12年后,为台下的这些人创作一首给他们的歌——《今天雨,可是我们在一起》。

2005年,除了李宇春夺冠,其实还发生了两件事在被庆祝着:一件是英特尔正在庆祝自己入华20周年,还专门成立了一支投资基金,规划了一系列投资计划;另一件是中国计算机界正在筹备人工智能诞生50周年的纪念活动,彼时的人工智能还坐在冷板凳上。

12年后,这几条线有了一个交点:李宇春为自己的粉丝写了一首歌,歌曲的 MV 由英特尔提供技术,而这个技术就是现金掀起巨浪的人工智能。

雷锋网了解到,在这支 MV 中,为了表达歌曲传达的情绪,有很多雨水贴在面部、鲤鱼游过面部的画面场景,这些图案特效需要经过影视后期的设计和加工,更需要在英特尔3D人脸面部表情捕捉技术基础上,与面部进行贴合。在英特尔于成都举办的品牌之夜活动上,AI科技评论也体验了该技术,通过面部表情的变化,该技术可以即时在脸上贴合一些“奇怪的东西”,比如恶魔、蜘蛛、雨水等。

英特尔3D人脸面部表情捕捉技术,能够实现人脸的自动检测与识别,定位人脸的78个关键点,快速重建3D人脸,并且实时跟踪面部表情变化,从而将预先设计好的特效素材附着在3D人脸上,重新渲染到MV视频中。

有一点不同的是,以往的表情捕捉技术需要在人脸做标记点,需要较为复杂的传感器,而应用了深度学习算法后的技术,则不需要上述两点,更为智能。

做到这一点其实依靠的还是机器学习,英特尔中国研究院王山东表示,基于大数据,通过数十万张人脸的数据库,实现了一个低精度的视频、摄像头捕捉到的照片或视频都能够精准的识别人脸,随着人脸数据库,精度会上升。这项技术能够应用于任何3D特效公司。

除此之外,我们还和英特尔中国研究院院长宋继强,就英特尔在人工智能领域的研究与布局聊了聊。以下为采访的Q&A 部分,AI科技评论在不更改原意的基础上,做了调整:

记 者:英特尔在 AI 方面的布局依据什么思路?

宋继强:人工智能本身范围非常广,看你怎么去定义,如果只是深度学习,就很窄了。如果说把其他经验借鉴进去,比如规则、推理、机器人等,这些都算在广义的人工智能领域。

英特尔的布局首先是解决训练的问题。训练现在是依赖云端的,像英特尔®至强®处理器、英特尔®至强融合™处理器,还有收购的 Nervana,刚才我讲到灵活的多任务处理的结构,英特尔®至强®处理器、英特尔®至强融合™处理器便能给予的,如果针对于某些密集的训练需要的专业加速,比如深度学习相关的,那就是 Nervana 的 Lake Crest 可以给出来。目前来讲,训练比较流行的是深度学习算法,它能把一个模型训练到解决某类问题。比如,训练好之后就可以做语音识别、人脸识别、或者物体检测,有不同的功能。

训练好之后,会面临一个问题就是部署,部署实际上不涉及训练,它就是要快、成本低,功耗低。英特尔收购的另外一些公司,比如说 Altera,它的 FPGA 实际上是一种低成本、低功耗的硬件加速单元,它是用来覆盖哪些市场容量不是很大的情况,市场容量大的时候 FPGA 的性价比就没那么强,这种情况下开始有 ASIC 的方案出来,像 Movidius,就是我们收购的在前端非常小的功耗要求下,能够把带深度学习能力的计算视觉算法加速。

记 者:英特尔中国研究院主要负责什么?

宋继强:英特尔中国研究院主要做视觉相关的人工智能的核心算法,包括人脸识别技术、情绪识别、场景理解。今天的体验英特尔3D人脸面部表情捕捉技术是人脸技术的延伸,人脸技术已经做了10年多了,现在也做物体的识别检测和深度神经网络的压缩,压缩主要是在一些部署的时候前端的硬件资源是有限的,内存有限,计算能力有限,所以我们把训练出来很大一个模型压缩到原来的1%,但是保持工作时候(例如推理的时候)的精度,这是很重要的技术。

情绪的识别,就是表情的识别,目前也是学术界比较流行的叫情感计算主要的基础。不光是看到这里有人,这是谁?要开始去理解人的情感。

还有一个技术是做场景的理解,让计算机去看一个视频的场景,能产生文字,等于说加标注或者是加解说词,这个是非常有用的技术,对无人驾驶、机器人、智能家居都非常有用,可以把场景的情况语义化,因为我们知道其实文字具有很多种技术,可以接着开始往后做,更多一些怎么去理解,怎么去做意图分析,怎么给人提供相应的服务,怎么去给场景进行一些意外的检测,这个是学术界很热的。叫做 Visual Understanding。这三块是基于视觉的人工智能技术。

另外一块,是我们研究院最重要的跟人工智能相关的研究,就是机器人——家用机器人,我们的目标是推出一套基于异构计算平台的家用机器人开发平台,这种平台可以帮助很多研究的团队(不具备完整的平台搭建能力),推出这个以后他们可以基于这上面做他们想做的,我们把基础的运动能力、感知能力和加速放在上面,这个平台基于酷睿级别的CPU加 FPGA,也可以选择性加上 Movidius 神经计算棒推出去。

记 者:中国研究院的研究人员有多少?

宋继强:大概全职有60几位,实习生有20几个,加上 supporting,不到100吧。

记 者:英特尔中国研究院是除了美国以外最大的?

宋继强:对,英特尔研究院一共800人左右,有600人是美国本土的,分成四大块研究方向,是英特尔关注的:

  • 第一块是电路和架构
  • 第二块是系统和软件研究
  • 第三块是5G,甚至更前沿的无线通信研究
  • 第四块是安全技术和隐私管理技术

这是美国的四大function lab。

在海外有两个是称为地区性的研究院,一个在中国,另一个在欧洲。欧洲是组合的,一部分在爱尔兰,一部分在德国,目前有40多人,那边可以调用欧洲的大学资源,研发很先进,有很多研发投入。英特尔中国研究院,也利用中国的人才和中国的一些产业政策,我们做的结果是希望能够辐射到全球的。

记 者:阿里成立了达摩院,英伟达宣称攫取了人工智能行业80%以上的利润,听上去这些公司都是显得更前沿,对此您怎么看?

宋继强:英特尔研究一直是前沿的,我们没有讲太多,比如最近我们将神经元芯片、神经拟态芯片、量子计算方面的东西,我们在前沿的领域已经有不错的工作,有一些是在世界领先的。

目前人工智能市场不大,在英特尔看来目前的投入都比较及时,并且能在未来产生商业价值的时候我们的产品已经存在。目前整个数据中心中,跑人工智能占比较小。但是其未来三年增速可能是12倍。面对这样的增速,我们就有应对方案。此外,海量数据不光是在服务器做训练,做存储(英特尔有3D XPoint),做通讯有很好的方案。在前端,很多客户遇到的问题,部署时,如果使用GPU是不可取的,功耗高;在前端需要价格低、功耗低,在部署层面上如何更好的做推理,同样需要多样化方案。这一块英特尔已经看到市场上的产品,例如收购的 Movidius,在市场上推动其快速迭代,FGPA 也在推动在这些领域的进入。英特尔接收到全球的动态,在多种方案上进行推动。

记 者:人工智能芯片市场怎么样?

宋继强:人工智能目前是属于婴儿期,是英特尔的普遍认知,未来10-20年都是产业向上发展的,现在判断什么是最后的芯片方案为时过早。芯片需要靠应用去确定,在应用落实前无法判断什么是最终的芯片方案。

目前人工智能热在于深度学习在学术界的突破产生的。深度学习在学术界使用的GPU方案去做,当算法都迭代完毕,主要看谁的芯片最厉害的时候。但是无法判断未来演进方向,包括一些指标仍然在不断引进。这个指标里面,离谁是最后的赢家,还有一段距离。

记 者:收购和投资小厂的时候有什么标准?怎么判断?

宋继强:和英特尔有战略相关性的才会去投,其次技术必须是领先的。

记 者:英特尔与 Facebook 合作开发人工智能芯片将在年底推出,该芯片会有哪一些突破?

宋继强:去年我们有讲 Lake Crest 芯片架构,目前应该是一脉相承,既提供了很多的并行张量计算单元,都是用块去计算的,提高了很多高密度计算,而且计算扩展性也很好。一个芯片一代可能只是一个PFlops的运算,如果需要多的话,可以通过几个芯片去组成阵列,继续增加你的运算资源。

芯片和芯片之间的运算必须保持高带宽,低延迟,专门设计了 cell 通路,保证芯片之间通讯足够快,带宽足够高。在扩展芯片支持尺寸的时候不会带来额外的一些代价,这些是他们设计的要点,而且在计算能力方面领先。而且上面有一套软件,这个软件帮助用户拆分数据流里面放在不同应用领域加速。有一套软硬件集合的方案,基于这些应用优先考量。Facebook有很多种不同的社交数据,这些不同测试应用,看这个芯片到底怎么样才能够优化。今年底出一个测试点,在过一段时间正式点,正式出来是选择很好的合作伙伴,可以让我们通过训练来迭代。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-11-06

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏SIGAI学习与实践平台

AI时代大点兵-国内外知名AI公司2018年最新盘点

在人工智能领域大规模并行计算是一个刚性的需求,CPU由于本身设计更偏重于多任务处理、逻辑控制所以不太适合在矩阵计算这种需要高并行的场景中应用,这也给了像Nvid...

901
来自专栏新智元

英特尔年底出货神经网络处理器,到2020年深度学习训练性能提升100倍

【新智元导读】英特尔神经网络处理器NMP终于确定将在2017年年底面世,现在传出与Facebook合作的传言。《财富》报道称,Facebook为芯片设计提供了...

3745
来自专栏镁客网

2017中国人工智能峰会盛大开幕,李开复、胡郁等大咖云集现场

1160
来自专栏新智元

【计算神经科学】脑科学与人工智能的必要桥梁

引言:一个国际神经学家团队朝着在计算机上模拟人类大脑迈出了小而重要的一步:建模老鼠大脑。他们公布了鼠脑组织至今最为详细的数字重建:模拟了3万个神经元和大约4千万...

3637
来自专栏挖掘大数据

大数据助力传统供应链方案:降低库存30%

供应链是由供应商、制造商、仓库、配送中心和渠道商等构成的物流网络。近年来,供应链管理在企业发展中占据着越来越重要的战略地位,成为企业”第三利润的源泉”。对于很多...

3206
来自专栏镁客网

「科技」新型芯片出炉!只需10分钟就可为手机充满电!

1412
来自专栏PPV课数据科学社区

世界杯博彩狂欢你赶上了吗?数据预测还会改变哪些行业?

? 从天气预报看大数据预测的四个条件 在互联网之前便已经有基于大数据的预测分析了:天气预报。因为互联网,天气预报为代表的大数据预测的以下几个特征在更多领域得到...

1973
来自专栏新智元

图说2016深度学习十大指数级增长

【新智元导读】深度学习火热不是假象,以下的十个指数级增长趋势证明:深度学习在过去的一年内获得了极快的发展,已经成为当下人工智能的“顶梁柱”。本文从 ImageN...

36212
来自专栏新智元

【北大AI公开课第二季】雷鸣开讲:创业公司如何突围BAT垄断

---- 新智元报道 作者:艾霄葆 【新智元导读】2月28日,北京大学“人工智能前沿与产业趋势”系列课程如期开讲。第一讲,北大人工智能创新中心主任雷...

3496
来自专栏腾讯高校合作

腾讯云开放优图技术,加速智能安防行业发展

在好莱坞大片《速度与激情7》中有一个被称为“天眼”的系统。它可以调用世界上任何地方的摄像头,通过人脸识别技术来搜索你想要的人或事物,让其无所遁形。...

3607

扫码关注云+社区