首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

对话吴运声:“双马对话”受启发,AI视觉落地将加速

作者丨白金蕾

编辑丨王进雨

8月31日,2019世界人工智能大会举办期间,腾讯优图实验室(下称:优图)总经理吴运声接受了包括新京报在内的少数媒体专访。在他看来,虽然近几年人工智能热度不断提升,但计算机视觉领域正在逐渐回归理性,真正有技术含量和产业应用价值的研究得以沉淀,将实现计算机视觉研究和落地双加速。资料显示,2019年整个人工智能视觉领域的规模可以达到三百亿元,增长率达到168%。

一年前(2018年9月30日),受宏观经济环境、游戏版号限制、“投行化”等影响,腾讯总办主导了战略升级和架构调整,将原有七大事业群整合为六大事业群。腾讯高级执行副总裁、云与智慧产业事业群(下称:CSIG)总裁汤道生在接受新京报记者专访时称,架构调整之后,将使腾讯的技术力量更聚焦,能为产业客户提供更完整的解决方案。

由汤道生回答不难看出,未来腾讯AI将更加面向场景和产业。优图实验室的技术与场景融合的定位,也更加符合腾讯构架调整后的思路。一年中,优图以计算机视觉为核心,围绕社交娱乐、工业生产、社会进步、前沿探索四大方向,同腾讯云、微信等一起输出解决方案。目前,在腾讯内部有超90个产品线使用优图技术,已经建立了医疗、教育、零售、金融、自动驾驶、社会公益等超过15个行业解决方案。

吴运声是优图的联合负责人,他于2012年从零开始搭起了优图实验室,目前人员规模在300人左右,其中超100人具有知名院校博士研究生学历,已经积累了超过七百件全球专利,超过两百篇各种视觉顶会论文。

随着腾讯的技术战场从消费互联网延伸到产业互联网,优图的定位也在发生变化。“加入CSIG后,老板对我们考察的一个重要部分就是怎么跟腾讯云结合打造各种各样的解决方案,帮助实现智慧产业的目标,这就是我们实验室存在的价值。”吴运声告诉新京报记者。

在他看来,优图与旷视、商汤等人工智能“小巨头”在行业解决方案的不同在于“优图不是单兵作战”,“我们不是纯的只是计算机视觉解决方案。比如刚才我们提到智慧社区的解决方案,它不仅是计算机视觉,还有地图、云计算等,是把腾讯各业务线的优势整合,输出整体解决方案。”同时,腾讯内部对人工智能的包容度较高,试错成本较低。

此前腾讯内部几个人工智能实验室存在“赛马”问题,汤道生在构架调整后接受新京报专访时曾表示,旗下优图实验室与AI Lab已结束“赛马”,两个实验室都由副总裁姚星管理,作为腾讯顶级的两大AI实验室,会在研究方向和落地领域里做更好的分工与协同。吴运声则进一步表示,通过不断地发展,几个AI团队都有自己比较擅长的地方:优图在计算机视觉这一块做得最多;微信AI是语音识别做得更出色一些;AI Lab在内容、游戏、社交和平台工具型AI更擅长,目前也有“绝艺”、“绝悟”;AI Lab西雅图在远场的语音上做得很好。

他透露,未来自己将更多专注教育、零售、金融、安防、社会责任等产业落地领域,实验室的另外一位联合负责人贾佳亚则更关注前沿研究,以及工业、医疗影像和自动驾驶等业务研究落地。最近腾讯和宝马在自动驾驶领域达成了战略合作,工业质检解决方案也已经应用到液晶面板的检测当中,并和主流手机厂商达成了合作。

本届大会中热议的“双马对谈”,也引发了吴运声的思考。作为技术研究人员,他认为特斯拉公司首席执行官埃隆•马斯克的发言,更贴合他的话语体系,而马云则带来了不一样的启发。

在他看来,目前人工智能在感知层面有很多不如人的地方,也有很多比人强的地方,但是认知和决策层面,在大部分的领域还是比较弱的,未来还有非常大的想象空间。

今年6月国家新一代人工智能治理专业委员会发布报告,提出发展“负责任的人工智能”,这是我国首次发布人工智能治理原则。8月26日,国务院副总理刘鹤在重庆智博会上呼吁,智能技术需要维护伦理道德底线,形成行业和企业的伦理自律准则。如何让人工智能被全方位治理,实现“可知”、“可控”、“可用”、“可靠”,成为大会的热门议题。

吴运声称,“我一直思考技术的准则在哪里,底线在哪里,最后发现科技向善是一个非常重要的价值观层面的事情。”他表示,腾讯旗下所有人工智能实验室使用的训练数据全部来自外部采买的合规数据,“内部用户的数据不会被分享出来,这个是底线。”

对于大会期间,腾讯优图联合英特尔正式推出AI视觉模组VisionSeed,吴运声称:“我们初衷是让更多的人,更方便地使用AI,普通人可以利用这个模组实现创意,不需要再训练人工智能模型。”他还称,该硬件模组是按照成本价出售,目前主要在跟大学合作,还会基于硬件模组开发一些人工智能的课程。

谈营收指标

“帮助实现智慧产业,打造行业解决方案”

记者:构架调整到现在接近一年了,云南的会上也发布了技术中台和数据中台。相当于优图在这当中扮演的是中台中的计算机视觉提供方?我可以这么理解这个角色?

吴运声:腾讯的技术中台是更厚的概念,AI只是技术中台一部分,腾讯有很多大数据处理能力、并行计算能力以及弱网络下交付的能力。包括很多统一部署的能力。所以在腾讯内部技术中台这个事情,是很厚、很宽泛的概念。AI是其中一个板块而已,优图又只是说AI里的其中一部分,优图只做CV,CV这一块主要承载是在优图这一块,优图是承载了计算机视觉算法。

我们会跟各个云的团队一起打造解决方案,它上层有各个细分领域云的团队,我们会跟各个细分领域云的团队去打造它这个领域解决方案,它这个领域会有商务人员、架构师、实施人员对接客户,去完成实时方案。

记者:腾讯内部有多个AI团队,可能会有重合,我们怎么去看技术重合或者领域重合?

记者:优图团队有营收上的指标?

吴运声:我们加入CSIG后,老板对我们考察的一个重要部分就是怎么跟腾讯云结合打造各种各样的解决方案,我们叫智慧产业,帮助实现智慧产业的目标,这就是我们的一个实验室存在的价值。

记者:是不是可以理解为优图实验室转向更加强调产品落地的方向?

吴运声:我们从来没有说更加强调产品落地,我们从一开始就非常强调产品落地,也强调技术研究。优图最大的特点就是我们的研究和落地结合得非常紧密,所以我们在技术方向上面并没有改变,而且我们在理念上也没有什么改变。

记者:我们偏向于是腾讯云的技术供应商,可以这样理解?

吴运声:只能说我们的视觉AI能力,比较大一部分是通过云去输出给客户,但其实我也不只服务于腾讯云,比如说我跟微信支付合作,跟社交产品合作,以及与生态合作伙伴的合作。

记者:面对CSIG内部解决方案的项目,同时也面对科技向善(公益类)的项目,会有优先级?这种情况下会怎么办?

吴运声:这个内部肯定会平衡,寻人这个真的投入很大?以前我们说跨年龄识别算法怎么来的?主要的基础还是在安防领域,以及传统领域积累大规模人脸识别的算法,通过我们独创DDL迁移的策略,把它迁移到跨年龄识别的方向上,而且取得了很好的效果。所以我们很大部分的投入还是做大规模的人脸识别算法,然后我们会有一部分人做学习和迁移的工作。

其实并没有很本质的冲突,当然在局部上面确实会有。比如说时间很紧张,某些项目很紧的情况下,那边可能会稍微放缓一点节奏,但也只是稍微放缓一点,我们认为在科技向善这种,或者有些情怀的投入上,我们还是愿意去持续投入的,哪怕它稍微慢一点点,但我们还是愿意去持续投入。

谈行业竞争

“我们不是单兵作战”

记者:现在竞争差异化在哪?比如说和旷视、商汤这种,它们去年好像也在做垂直行业落地,也有工业和医疗。

吴运声:我觉得在算法层面上大家都到了比较高的水平,就是比较接近的水平。我们跟它们的优势还在于我们跟云的一些优势,我们不是纯的只是计算机视觉解决方案。举个例子,刚才我们提到智慧社区的解决方案,它不仅是计算机视觉,还可能有地图。所以我们可以跟他们结合打造一个新的模式,这是我们跟其他公司是蛮大的区别,我不是单兵作战。

记者:腾讯在人工智能领域的竞争优势在哪里?

吴运声:(竞争)肯定是激烈的。腾讯有腾讯的优势,我们更多是结合腾讯云为客户打包完整的解决方案。单独的一个算法很多时候对客户是没有价值的,我们需要的是给客户(一个方案)解决完整的问题。我们跟腾讯云,包括帮(对方)做业务流程的梳理以及配套大数据的分析,结合视觉AI,还包括其他方面的AI,来做完整的解决方案去解决客户的问题。

记者:我们有要求使用AI解决方案的客户一定要上腾讯云?

吴运声:不是,就是Case by Case。坦率来讲,如果你在腾讯云上我能够给你提供最完整的服务,因为腾讯有什么样的机制,它的消息队列是什么样的,它的调用是什么样的,它的存储是什么样的,我心里非常清楚的,所以我给你承诺的结果是非常自信的。

记者:我们在做这种场景或者行业探索的时候,是不是会对不太好去渗透的场景有更多的耐心呢?我们对一些AI这种试错包容度会更高一些?

吴运声:我很有耐心,所以医疗都做了这么多年。因为你说的更高,我就不知道你跟谁比呀。对不对?我也不知道中小企业试错的包容度是多高,所以我们没有办法跟他们比,我只能告诉你我们的包容度是很高的。

记者:那我们的目的是什么?觉得这个行业带来的潜在价值以及回报更大?

吴运声:对,不管是社会价值还是商业回报价值。我本来也不指望做完一件事情半年之后就可以商业回报。包括我们自己优图的成长,也是老板们给予了非常大的耐心,我们从2012年开始做, AI火的时候是从2016年开始,前期也是老板们在持续投入,我们也没挣什么钱。

谈行业落地

金融领域基本满足,零售领域仍需提升

记者:集成工程层面的问题全部是腾讯自己来做?还是会有合作伙伴帮助?

吴运声:有些我们自己做,有些也会通过合作伙伴来做,腾讯这方面很开放的。

记者:我们把一个具体AI的产品从原生代码类的技术变成落地进某个场景里的产品,这中间需要一些过程,我们是怎么做的?

吴运声:从我的理解来讲销售只是生意,我们对生意关注得不是太多。

实验室做出来的东西可能只是解决了一个技术问题,它不一定能够解决客户真正的问题。举个例子,比如在智慧社区的场景,晚上灯光非常暗,做人脸识别、人体识别很困难,我们落地的时候会有一些研究人员到一线看具体情况,做一些补光的方案,这些补光的方案本质上跟AI没有什么关系。

记者:这个过程你们会不断参与其中吗?比如说交付过程当中遇到困难怎么办?

吴运声:我们会有节奏地参与,如果说非常高密度的参与我们的人力也是吃不消的,我们会在关键的环节去参与。

比如说一开始在确定需求的时候,前场也许不能够准确判断客户的需求到底能不能实现,属于要实现的话能实现到什么样的程度?一些不能实现的需求,到底是说一直不能实现,还是可以有一些绕过去的方法建议它怎么实现?这些问题在前场的人员,对技术理解过去和未来判断不准确,我们的研究人员会一起帮助他见客户帮助判断。在解决方案打造的关键环节,我们的研究人员也会走到前场去做相应的观察,在关键节点上做出判断,在交付环节如果说能够在现场实现比较顺利的交付,不需要研究人员更好,如果在交付的过程中因为客户总是有一些定制化的需求,我们也会参与支持。

记者:通常来讲怎么选择具体的落地场景?其次到了这个场景当中的决策过程是怎么样的?未来会有更多场景的选择,我想知道你的场景怎么决定?

吴运声:一方面我对技术能力有一个初步的判断,另外我需要看这个场景整个业务流程是什么样子的,我的技术能力是不是能够优化它业务流程,或者在它整个流程过程中去帮助到他解决什么样的问题。

记者:客户对于咱们现在的解决方案期望和能实际达到的效果是怎么样的状态?

吴运声:这个问题不同行业不一样,有些行业满足客户预期挺好的,比如说现在2C的领域,美颜甚至超出自己的预期。现在在金融行业某些局部领域里,我觉得可以说是相对比较符合预期的。在零售行业,新零售前几年很火,但如何帮助零售客户降本增效,我认为还有非常大的提升空间。

举个例子,这个能不能做虚拟试衣,这样不用试衣间了,但是现在事实上的情况在于说很难做到非常逼真,你把一个衣服贴到身上的时候还是很生硬,而且你也不能转来转去看贴合度,更重要的是没有办法知道质感。

谈人工智能

未来“在绝大部分的认知和决策层面还非常弱”

记者:看你们前沿的研究里有步态识别,是否说明多模态已经成为计算机视觉新的引用方向?

吴运声:技术一直是往前发展的,比如最早的时候,用深度学习来计算一个客流通过时的人数或者通过的人群密度,发展到今天希望更精准地抓取,然后进一步发展,在很多跨摄像头的地方看不到这个人的人脸,我们就出了RiID方案。再到一些场景我们发现抓人体也不好抓,或者过程中(对方)把衣服换了,这个时候我们会研究一下步态的特征,步态是相对比较稳定的,几十年形成的特点。技术上的研究是一脉相承的,在新场景下会遇到新问题,我们会为了解决新问题让技术不断演进。

第二个层面是对抗性,在对抗的过程中成长。黑产、灰产不断有对抗的手段,在解决对抗问题的过程中,我们也在不断推进技术往前发展。

记者:听说有把技术用在工业质检上,想问用在了哪个手机厂商的生产线了吗?和人脸识别相比,哪个难度高?

吴运声:我们现在在液晶面板上的检测已经在做了,已经有落地的合作了。它跟人脸识别的特点不一样,人脸识别技术很难,但我铺一百个人研究人脸的算法,我可以用到每一个人脸上。但是面板检测一个面板就有数百道工序,每个工序都不一样,所以我做完了这道工序的这个模型,不是直接能够用到第二道工序,第二道工序我还得再做一遍,所以它的量非常大。我们一方面是说要做不同的模型去适配解决不同工序的问题,另一方面还得抽象看技术上的共同点,把共通的东西做出来。

记者:年初提到优图在2019年会多关注一下自动驾驶的进展,不知道现在如何?

吴运声:对,自动驾驶是贾佳亚教授负责。2019年贾教授会兼任到自动驾驶中心去兼管自动驾驶,现在在自动驾驶技术上确实还是有突破的,最近跟宝马也有一些比较大的战略合作。

记者:未来会考虑和更低龄的AI教育场景合作吗?

吴运声:有在考虑,比如说掌控板以及儿童编程,他们也会有一些乐高机器人以及类乐高级别的机器,前面加一个VisionSeed会有更高级的玩法,也有考虑。

记者:如果我们拿视觉技术来讲,是不是感知上大家已经做得非常好了?现在大家都在比拼认知和决策?

吴运声:就目前来说,其实有很多问题还解决不了。比如说暗环境下、大姿态环境下,能不能把人识别出来?或者很简单的我坐在这里我背对着你,我换一件衣服,你认出我是没问题的,但是计算机不一定。

你刚才说感知层面到了非常高的水平,这个我也是不太认同的,计算机跟人不太一样,它在某些领域远远超过了人,但是某些领域,还有非常大的提升空间。

记者:未来有哪些领域有不一样的设想?

吴运声:在感知层面还有很多不如人的地方,感知层面也有很多比人强的地方,但是认知和决策层面,在大部分的领域还是非常弱的。其实还是有很多的问题并没有解决,至于说新的领域,比如说现在还有一些遥感图像的分析,大面积农业图像分析之类的,很多领域做不过来。也可能是说从商业的角度来讲,某些领域是因为投资回报率不够,所以说暂时放弃这种领域,没有在这种领域投入“重兵”。但是我觉得随着技术的发展,技术的成本肯定是下降的。现在投资回报率不够,也许过一两年投资回报率就起来了。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190903A0M8O800?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券