前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >旷视王珏:前Adobe首席科学家,手握64项专利,曾助力拿下奥斯卡科学技术奖

旷视王珏:前Adobe首席科学家,手握64项专利,曾助力拿下奥斯卡科学技术奖

作者头像
新智元
发布2019-08-05 14:38:06
2.5K0
发布2019-08-05 14:38:06
举报
文章被收录于专栏:新智元


新智元原创

编辑:金磊、张佳

【新智元导读】他,是前Adobe历史上升职最快的首席科学家;他,同时在三大顶会发表过65篇学术论文、手里带过31位博士实习生、获得了64项美国专利; 他,因与孙剑一“面”之缘加入旷视,堪称脾气最好的Leader、旷厂“人缘王”,“大尺度”科幻电影爱好者,曾助力拿下奥斯卡科学技术奖;他,正带领一支全球团队,缔造AI影像之王;他,就是旷视美国研究院负责人(MEGVII Research US)——王珏。

提到旷视,除了孙剑,你还应该知道王珏。

或许,这个名字你不是很熟悉,没关系,这很正常,毕竟大牛都是非常低调的。

然而,正是这样低调的人物,曾同时在计算机视觉、计算机图形学、人机交互三大领域最高级别会议和期刊发表65篇学术论文。

也曾在9年时间里手把手带领过31位博士实习生,获得了64项美国专利,实现了13项重要技术的研发和产品转换。

还曾是Adobe Research历史上升职最快的首席科学家之一,提出的技术做成产品后,曾拿下奥斯卡科学技术奖。

如今,他转战旷视,率领一支全球团队,正把深度学习+计算摄影推向极致。

他就是旷视AI影像之王的缔造者——王珏。

师出名门的清华学霸,助力拿下奥斯卡科学技术奖

项目完成前,只吃鸡肉炒饭

哪有什么所谓的天才,还不都是孤独地翻山越岭。这句话用在王珏身上再合适不过了。

2003年,从清华念完本科和硕士的王珏,前往美国华盛顿大学电子工程系攻读博士学位。

在此期间,“两点一线”是他的常态。正如王珏自己所述:“我在做研究的过程中,一旦进入状态,就不想打断它。

这也正是为什么连圣诞节期间,他也会开着车到学校泡在实验室里的原因,也造就了王珏每年发表2篇顶会论文,3年得到导师毕业许可的“神话”。

而他在刚刚工作接触项目时,还是会保持这种习惯——项目完成前,只吃鸡肉炒饭

“若是每天想着去哪儿吃,吃什么,非常麻烦。而当时公司附近刚好有一家不错的鸡肉炒饭,于是我们默认都去那里解决吃饭问题。”

除了“嫌麻烦”,王珏另一个如此废寝忘食的原因是他很珍惜这种状态,就仿佛身处于科研的高峰体验,静待“突破”孕育而生。

求学期间获点拨,助力拿下奥斯卡科学技术奖

除了自身的努力之外,来自“外界”的点拨与启发也非常重要

王珏读博士期间与多位名师有过深入的合作,分别是李衍达院士、微软亚洲研究院的徐迎庆、王坚和沈向洋博士,以及计算机图形学泰斗级人物Michael Cohen。

在李衍达院士的实验室中,王珏主要辅佐医学图像处理方面的工作,在与微软亚洲研究院的众多大牛的合作中,王珏主要负责数字墨水和卡通、交互图像视频处理等工作。

这让王珏一开始做研究便跨越了多个领域,培养出了宽阔的视野,为后来的工作不论在技术还是思想层面,都奠定了一定的基础。正如王珏所说:

“像徐老师,他不仅擅长图形学和计算机视觉,在动画等领域也比较擅长;王坚老师是心理学博士出身,但在人机交互方面的工作也是十分出色。因此他们在做工作的时候,思想、视野都是比较开阔的。”

也正是这种长期不懈的坚持,王珏博士毕业加入Adobe Research的几年期间,不断取得突破,创造了硕果累累的业绩。

而在发表的众多论文中,让王珏印象最为深刻的是2007年发表在SIGGRAPH的一篇题为《Soft Scissors: An Interactive Tool for Realtime High Quality Matting》的文章。

论文地址:http://www.juew.org/publication/softscissors-SIG07.pdf

在这篇文章中,王珏提出一种用于实时提取前景蒙版(alpha matte)的交互式工具——Soft Scissors,它是一种新的实时在线matting算法,可以在复杂的前景对象(如毛茸茸的动物)中提取高质量的蒙版。

系统流程图

甚至可以实时调整画笔的宽度和边界条件。在高质量图像matting和合成任务中,Soft Scissors是第一个可以做到又快又准确的交互式工具将一系列的算法创新融入到一个小小的笔刷之中

这篇论文虽然很较短,只有6页,但却是最能体现王珏论文风格的一篇——注重实用性

在此之前,大家在这个领域所做的工作更侧重于数学层面上的建模与优化,而王珏是从用户的角度出发,打造一个好用的实时系统,将复杂的算法融入到简单、流畅的交互过程当中。

也正是基于“王珏特色”的研究工作,使得像美国好莱坞的影像特效公司Digital Film Tools买下了技术版权并做成了产品。而就在今年,这家公司凭借着该技术,获得了奥斯卡科学技术奖

回首狂扫顶会论文的这些年,王珏总结其修炼之路的经验为:

  • 选择自己擅长的工作,认清自己的优、劣势;
  • 文章立意要新颖,若是启发性不够或者较为雷同,完成论文会较为困难;
  • 为自己寻找思维开阔的导师。

从美国顶级公司到国内创业公司,“一碗面”引发的人才迁移

身处Adobe九载,一“面”之缘加入旷视

在学术上屡获佳绩的王珏在工作上也是一把好手。王珏曾在Adobe Research任职长达九年,并取得了非常不错的成绩。但他加入旷视,却源于和孙剑的一“面”之缘。

那时,王珏恰好和孙剑在西雅图,两人相约一起吃饭,聊的很投机,一碗面的功夫,王珏就有了加入旷视的打算。

告别Adobe时,王珏用“专利石”拼了自己的名字

那么最终选择旷视的原因是什么呢?王珏这样解释:

“主要是三个方面的原因。 一是和旷视有天然的亲近感。旷视出自清华姚班,企业文化中有清华行胜于言,脚踏实地的价值观。对于作为清华校友的我来讲,有着天然的熟悉感。 二是孙剑博士的诚意邀请。我和孙剑博士认识并同行多年,彼此都比较熟悉,他不远万里到西雅图来邀请我,我内心是无法拒绝的。 三是机遇。中国目前人工智能研究的环境,从数据规模到商业机会都比美国要好,但是在人才储备上仍然不占优势。能够帮助中国人工智能公司,特别是初创公司更进一步,在美国吸引顶尖人才为我所用,对中国高科技发展是一件里程碑性质的事情。这样的机会在人生中并不多见,碰到了就应该抓住”。

于是,2017年4月,王珏加入旷视,与孙剑负责的中国研究院遥相呼应。

旷视,效率最高的公司

加入旷视两年后,王珏步入了科研的快车道。与偏向于温室的Adobe不同,作为一家创业公司,旷视的节奏是很快的,需要有短时间内攻克难关的能力。

王珏在Adobe做的第一个项目是关于视频里面交互物体的分割,前前后后3年时间产品才发布,而同样难度、甚至更高难度的项目,通过团队协作,旷视4-6个月左右就能落地。

用王珏自己的话讲:旷视是他见过效率最高的公司

王珏(左二)参加2018旷视北京年会

旷视之所以能够如此高效的运作与几个地方默契配合分不开。旷视在北京、上海、南京、成都设有研究院,如此一来,项目推进就可以做到24小时不间断,国内休息,国外接着干,再加上团队的默契配合,才会有如此高的效率。

为什么最近几年大家觉得苹果的创新速度变慢了?王珏认为可能是因为过于温室、压力小,所以脚步放慢了。对于赶超,王珏很有信心

两年铸一剑,打造国际顶尖AI水平团队

旷厂“人缘王”,关键时刻冲在第一线

工作中的王珏是怎样的呢?

Leader一般分两类,一类是强硬派,一类是温和派,王珏显然是后者,甚至还被誉为“旷视最和蔼可亲的Leader”,旷厂的“人缘王”。

慢性子的王珏喜欢先想清楚再决策,深知生气并不解决问题,作为Leader,他追求的是慢中求快,高效而平静是他最喜欢的工作状态。

王珏最喜欢的一个电影场景就是《指环王》中希优顿冲锋陷阵,带领士兵奋勇杀敌。在工作上,王珏对自己的要求也是如此,关键时刻冲在第一线。不光写代码、搞算法,包括数据采集有时也会亲力亲为、通宵作业。

《指环王》剧照希优顿王(左一)

生活中的王珏不仅没有领导架子,还非常关心同事。同事遇到难处,他都会尽力帮忙。之前同事买房,资金周转不开,多会找王珏借钱,获得帮助。有这样的Leader,员工更是无后顾之忧,工作起来干劲十足。

超强战斗力,打造国际顶尖AI团队

影像之王,这是旷视CEO印奇下达的一道“指令”。两年以来,王珏团队挺进目标已取得赫赫战绩。这主要归功于4个方面:

  1. 旷视原创自研的底层科研利器Brain++的有力支撑;
  2. 从问题和需求出发,推出一系列高水准论文,包括CVPR Oral在内;
  3. AI技术覆盖国内一线主流手机厂商,打造明星手机技术,比如OPPO Reno 夜拍超清画质;
  4. 团队冲锋陷阵,与国内打配合,24小时不间断推进项目。

王珏团队成立以来不断在壮大,而目前发展的状况,用王珏的话就是:“非常满意,层次丰富。

王珏团队成员

目前王珏团队成员主要专攻如下三个方面:深度学习、传统计算机视觉/计算机图形学、计算摄影

两年前,王珏在接受新智元采访时提到:“不追求将招聘重心放在顶级专家上,对于初创公司来讲,战斗力决定一切。”从目前成员构成来看,也的确如此。

正是如此小而精的团队,在今年CVPR 2019中就入围两篇论文,其中一篇为Oral:

论文地址:https://arxiv.org/abs/1901.00680v1

在这项研究中,旷视研究院首次提出了名为GeoNet的全新深度学习网络,可以建模点云所潜在表征的网格曲面特征。

并在点云上采样、法向量估计、网格重建及非刚性形状分类等多项经典任务中取得了最优结果。

而在另一篇工作中,王珏团队提出了GIF2Video的方法,解决了长期以来GIF动图颜色分层、模糊不清的困扰。

论文地址:https://arxiv.org/pdf/1901.02840.pdf

在CVPR 2019会议期间,王珏团队在做展示时,苹果、三星、谷歌等大厂的研究人员也会前来交流,并对其工作表示了高度的认可。

不仅是在科研方面,在将技术转化为应用落地方面也是较为成功的。正如王珏所介绍:“我们给各个手机厂商提供了不少非常原创的技术,现在我们的客户口碑是非常好的。

比如,旷视的raw域超画质技术,将最好的深度去噪算法和最优的传统算法结合起来,不仅在OPPO Reno手机上率先落地,更是受邀在高通和MTK的展会上进行了多次技术展示。

除此之外,旷视研发的超清夜景人像,大光比人像HDR以及人像AI微整形等多项技术已经广泛应用于国内主流手机产品中。

其中,大光比人像HDR算法还流传为旷视的一段佳话。有一次,团队某个项目搁浅一周没用进展。当时王珏随时随刻都在思考这个问题,终于灵感在机场降临——他当场在候机室写出了正确解决问题的大光比人像HDR算法。由于诞生在机场,这一算法又顺理成章地被称为“机场算法”。

旷视在CVPR2019上展示的超画质技术

而在此“荣耀”的背后,王珏团队也是付出了异于常人的努力。

去年7-9月份,团队所面临的项目挑战可谓是极其艰难,团队成员纷纷“冲锋陷阵”,几位同事甚至直接住在了公司。

加之与旷视国内研究院的协战,整个旷视团队相当于每天24小时不停奋战,最后终于攻克难关,取得胜利。

带领团队向前走,正是王珏所最为骄傲且认为值当的事情。

“大尺度”电影爱好者还有些话要送给后来者

工作之余,王珏是一名“大尺度”科幻电影爱好者。这里的“大”尺度是“宏大”的大,王珏喜欢通过看宏大的、宇宙尺度的科幻片解压。他对科幻电影的喜爱可以用“狂热”来形容。

王珏与《星球大战》角色楚巴卡合影

《流浪地球》在国内上映的时候,王珏兴奋得不得了,身在异国的他按耐不住内心的激动,给国内的朋友们买票替他去支持国产科幻片。后来美国上映了,王珏马上去电影院看。

而王珏的这一爱好也许与他的科研也是”一脉相承“。AI技术的高速发展,打造的正是像科幻大片里超未来的世界。而王珏所做的工作,可以说是在实现着他的”梦想“。

最后,王珏将自己摸爬滚打这么多年的经验总结成两点送给后来者:

1、要深入到问题的本质

希望大家能够沉下心来,在学习新技术的同时,也去翻翻老的、经典的教科书,里面很多知识对以后的工作会非常有帮助。

2、做好当前这件事

未来具有高度的不确定性,有时候很难进行长远规划,但想要一个比较理想的契机,必须要做好当前这件事情,未来才会有更宽阔的空间。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-08-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 项目完成前,只吃鸡肉炒饭
  • 求学期间获点拨,助力拿下奥斯卡科学技术奖
  • 从美国顶级公司到国内创业公司,“一碗面”引发的人才迁移
    • 身处Adobe九载,一“面”之缘加入旷视
      • 旷视,效率最高的公司
      • 两年铸一剑,打造国际顶尖AI水平团队
        • 旷厂“人缘王”,关键时刻冲在第一线
          • 超强战斗力,打造国际顶尖AI团队
          相关产品与服务
          图像处理
          图像处理基于腾讯云深度学习等人工智能技术,提供综合性的图像优化处理服务,包括图像质量评估、图像清晰度增强、图像智能裁剪等。
          领券
          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档