专栏首页AI科技大本营的专栏普通人也能用AI拍出3D大片?这位清华博士后这么做

普通人也能用AI拍出3D大片?这位清华博士后这么做

从《阿凡达》到《流浪地球》,从好莱坞科幻 3D 电影之最到中国科幻 3D 电影之最,从 2009 年到 2019 年,近十年的岁月,见证了中国 3D 影视制作的快速成长和繁盛,也刺激着赵天奇探索人工智能与影视制作结合应用的信心。

影视制作中,科幻电影的火爆让全球影迷感受到了 3D 特效的魅力,这与近年来人工智能技术的突破性进展密不可分。

“比如《流浪地球》的每一个镜头都需要手工制作,这个过程十分复杂,耗费的人力成本也非常之高。人工智能影视制作就是用 AI 替代影视行业中大量的比较枯燥、高成本、低创造性的工作。”聚力维度创始人、CTO、Qualcomm AI 荣誉技术大使 赵天奇如是说。

多年来,赵天奇一直专注人工智能与影视行业的结合创新。北邮读博期间,他创立了一家名为十二维度的公司,定位于数字图像及 AI 在 3D 影视方面的应用,当时,VR 市场的火爆让 3D 找到了最佳落地方向,但他并不满足,在赵天奇的带领下,2016 年,科幻成真实验室首个人工智能 2D 转 3D 平台 “峥嵘” 上线,而他现在还是清华大学人工智能影视方向的博士后。

自动实现 2D 转 3D 有何难?

2011 年开始,随着谷歌、微软研究团队先后将深度学习应用到语音识别领域,2019 图灵奖获得者 Geoffrey Hinton 团队在 ImageNet 大赛中利用深度学习将图片识别的错误率大幅降低,由深度学习技术推动的人工智能开始得到更多科研机构、工业界的高度关注。

尽管那时人工智能的概念还没有如今这么火爆,但赵天奇敏锐地察觉到深度学习背景下语音识别、计算机视觉在影视行业所变革的潜力。

传统的 3D 内容制作技术主要有两种:一种是 3D 双机实拍,一种就是 2D 后期转 3D,但仍需要耗费巨大的资金、人力和时间成本。而技术的瓶颈直接导致 3D 内容的匮乏,目前国产 3D 电影呈扎堆之势,但成熟者却不多。那么,将 2D 视频渲染成 3D 有哪些技术难点?

赵天奇强调,一是影视内容的类别十分复杂,例如人物场景、自然场景、历史场景、想象场景等,每增加一个维度就上升一个级别;二是对观影效果的要求非常高,将丝毫的抖动误差排除到最小。为此,他们针对性地设计了多级神经网络、时空复用信息、对抗神经网络等技术,最终达到了院线级的水平。

很多算法是 “玩具级”的,只能用来娱乐

目前,聚力维度在 3D 领域的产业化已经非常成熟了,包括院线电影、电视剧、视频直播等 ToB 领域,以及涉及个人短视频、2D 转 3D 的 ToC 领域。

谈及此前争议颇多的 “AI 换脸” 技术,在赵天奇看来,“有很多算法都是‘玩具级’的,娱乐可以,但没有人用它来生产内容。”

他认为,如果将人工智能的应用分为识别、决策、生成、理解几种任务的话,聚力维度是一家专注于影视产品生成的公司。怎么理解呢?“就是给人去看、去听,而不是帮人决策。”

聚力维度还联合 Qualcomm 共同为终端用户提供语音技术服务。赵天奇认为,Qualcomm 本身在移动端的基因非常深厚,也是非常符合场景需求的,对于 AI 技术快速落地到移动端,也是最有发言权的。

当然,这只是一个起点,未来在 ToC 领域像变脸、面部捕捉、动作捕捉、3D 转换等(技术)双方都可以进行更全方位的合作。而且,赵天奇团队也在积极探索真人级的面部捕捉、动作捕捉技术,计划与电视台等合作落地“虚拟主播” 项目。

不久前,赵天奇被评为 Qualcomm AI 荣誉技术大使,这无疑是对其团队的一种肯定。赵天奇强调:“我们做这个方向在 AI 领域确实也是一个比较独特的方向,相对于大热的安防人脸识别、自动驾驶决策等领域,影视生成并不是所有人都能理解的。但我们也发现:不管是影视传媒还是互联网领域的合作伙伴,都可以与之合作加速 AI 影视制作的落地。”

“人人都可以做影视作品”,是赵天奇对当下 AI 在影视行业产生变革的愿景。例如,定制化电影、时效性电影、多结局交互游戏式电影都是他们正尝试突破的方向。未来,赵天奇还希望利用 AI 技术将面部捕捉、声音捕捉、动作捕捉、动作生成全流程覆盖,真正实现“视频作家”,并将全流程服务在产业中快速落地。

专用人工智能是没有泡沫的

据英国风投基金 MMCVentures 发布的最新研究报告显示,欧洲 2830 家标榜为 AI 的公司中,有 1580 家符合 AI 公司的定义,也就是说,近四成的公司其实和 AI 没有任何关系。当时,这一数字的公布,引起了圈内不小的震动。

“从现阶段来讲,如果大家对通用人工智能 / 强人工智能有所期待的话,这件事情应该是有泡沫的;相反,专用人工智能,从本质上是没有泡沫的。”赵天奇认为。

他还建议:专注于高校里的研究人员,更适合研究通用人工智能,因为企业拥有数据,在盈利压力之下,可能会在某个专项问题上比高校内的研究人员取得更为突出的成果;但同样企业需要盈利,就无法专门去研究通用人工智能,所以新的技术就可能出现在纯研究人员的高校群体中,“尽量往需要小数据,不需要数据,通用人工智能这条路上去研究;如果是创业者,一定要针对他自己熟悉的领域以及对应的专用人工智能结合,彻底地分析这件事情的可行性、局限性。”

当然,AI 算法只是意味着开了个好头,真正考验的是创新企业如何结合自身业务将算法进行商业落地。要知道,AI 的实际技术门槛很高,在发展过程中,真正的 AI 公司也可能遇到数据和技术的挑战。在这一点上,对于持续高涨的中国 AI 企业来讲更是挑战巨大。

对技术与行业时刻保持深刻理解,一定要两者结合才能形成真正落地的项目。”对于赵天奇而言,从最初 2012 年创立团队,经历了 2016 年颠覆创新,现在已经能准确把握人工智能与影视行业结合的痛点,让人人都能做电影,科幻般的人工智能影视制作方式成为现实。

特别提示:

Qualcomm 荣誉技术大使所发表的内容及观点均属原作者个人意见,并不必然代表 Qualcomm 或其分支机构的立场。这些内容仅供信息参考,并非获得 Qualcomm 或其他任何一方的认可或代表其观点。

本文分享自微信公众号 - AI科技大本营(rgznai100),作者:热爱分享的

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-04-24

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • AI一分钟|腾讯AI绝艺让二子,仍战胜柯洁;Google与腾讯达成专利交叉授权许可协议

    一分钟AI 腾讯又入医疗AI科学家,郑冶枫博士加盟腾讯优图实验室 Google与腾讯达成专利交叉授权许可协议,在科技领域为用户带来更好的产品和服务 百度研究院完...

    AI科技大本营
  • 那些打着AI万金油旗号的产品欺骗大众,如何识别?

    如今,很多打着AI名号售出的产品都属于万金油系列,没什么实质性的功能。为什么会这样?我们应该如何识别这类AI?

    AI科技大本营
  • AI行业求生之路:做算法的去养鸡场,做语音的卖鸡蛋,做视觉的送蛋炒饭

    编辑 | 胡永波 2018年1月16日,全球最大中文 IT 社区CSDN在北京蔓兰酒店举办了“ AI 生态赋能2018论坛暨 CSDN AI 新战略发布会”。本...

    AI科技大本营
  • AI时代大点兵-国内外知名AI公司2018年最新盘点

    据腾讯研究院统计,截至2017年6月,全球人工智能初创企业共计2617家。美国占据1078家居首,中国以592家企业排名第二,其后分别是英国,以色列,加拿大等国...

    SIGAI学习与实践平台
  • 变大、变大、再变大:长此以往,AI研究是死路一条?

    通过强大的云计算平台,人工智能研究人员已经能够在较短的时间训练更复杂的神经网络,这使得AI能够在计算机视觉、语音识别和自然语言处理等许多领域取得进展。

    大数据文摘
  • Al时代,阿里、诺基亚、同花顺等技术大咖带你直击人工智能多场景应用实践!

    但是,编程真的能够被深度学习、人工智能所取代?场主认为: 新的技术总是会驱动更多的岗位和机会,技术是生产力,技术人则是核心生产力!

    养码场
  • 学界 | 清华今日成立人工智能研究院,张钹院士出任院长

    AI科技评论消息,清华大学于今日召开清华-谷歌 AI 学术研讨会,并同时举行清华大学人工智能研究院成立仪式,中国科学院张钹院士出任首任院长,同时聘请姚期智院士作...

    AI科技评论
  • 暗物智能CEO林倞:五层认知架构,重塑多模态人机互动产业化|CCF-GAIR 2020

    2020 年 8 月 7 日,第五届全球人工智能与机器人峰会(CCF-GAIR 2020)在深圳正式开幕。

    AI掘金志
  • 人工智能发展的四要素

    毫无疑问,AI(人工智能)已成为了科技巨头保持领先、开拓新机会的核心要素之一。目前,无论是巨头还是创业公司都在积极理解AI,那马化腾先生是如何看待AI领域目前的...

    华章科技
  • Science组织了一场尖锐的Reddit问答,Yann LeCun的回答还是那么耿直

    机器之心

扫码关注云+社区

领取腾讯云代金券