前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >看球,我选上帝视角

看球,我选上帝视角

作者头像
量子位
发布2018-07-19 18:32:20
5490
发布2018-07-19 18:32:20
举报
文章被收录于专栏:量子位量子位
安妮 发自 凹非寺 量子位 出品 | 公众号 QbitAI

4:3,梅西回家了;2:1,C罗也回家了,这届世界杯真是激烈又精彩。

但对于无法前往现场的(伪)球迷们,只能屈身于手机、电视的平面看直播了吧?

在新技术应用一个接一个的今天,到底有没有更新、更技术的方式,重新定义一下看个球?

试想一下:如果可以通过AR设备,将赛况实时投到桌面上,并且随你移动,还能尽览不同视角不同距离的全场景球况,该是多么过瘾的一种选择。

就像这样——

再如这样——

噫……这是把世界杯搬到了任意桌面了么?而且还能各个角度绕着球场看比赛——就算身在现场也做不到啊!

恭喜你,这种“上帝视角”,可能不久就能实现了。

就在最近,华盛顿大学、Google和Facebook的研究人员开发了一套桌面足球系统,能将世界杯视频重建,转换成动态3D视频。通过AR设备,可以看到渲染后的球员动作和场地效果。

拥有了这个系统,感觉宛如拥有了整个球场,这到底是怎么做到的?

3D转换的秘笈

桌面看球的大思路其实很简单。

只要充分利用球场部署的多角度相机,之后通过多视角几何技术,对场地和玩家进行三维重建,2D世界杯就升级为3D场景了。

因此,研究人员提出了这样的思路——

先收集Youtube上世界杯球赛视频,根据场地线来推断相机的位置等参数。

随后,提取视频中的边界线、球员姿势和运动轨迹,将球员和场地分割,方便下一步加工。

“质壁分离”后,对球员进行单独的渲染处理来实现立体效果。研究人员用视频数据训练深度神经网络模型,在球场上重建每个球员的景深图,为实现360度无死角看球打基础。

最后,如果你有AR设备……用AR设备或者3D查看器渲染一下,3D看球美美哒。

思路没错,但紧接着问题就来了:

想训练神经网络模型根据球员图像来估计他的景深图,最理想的数据集里,应该包含着一对对的球员照片vs.景深图。

这样的数据集上哪找?

研究人员想到了EA出品的FIFA系列游戏。截取FIFA游戏引擎与GPU之间的调用信息,不就能从视频游戏的框架中提取景深图了嘛。

从FIFA系列游戏中提取图像及深度

机智。

现在数据完备,就差个能够预测景深的神经网络了。

研究人员选取了“沙漏网络模型”,用一连串残差模块,像一个个沙漏一样来处理输入,经过8个“沙漏模块”实施降低输入的分辨率、放大等步骤,输出的,就是我们所需要的景深图。

重建3D球赛,Go!

准备阶段完成后,研究人员开始重建3D场景。整个流程一气呵成,犹如进入了快餐店后厨——

大概分为以下几步:

  • 1.相机位置估计:用一个合成的平面场模板预估真实场景中每帧的参数,进一步找到相机在每个连续帧中的姿态。
  • 2.球员检测和追踪:提取球员的边界box检测到的关键点/骨架,基于姿态信息对初始的边界框进行细化,再根据提取的边框序列预计球员的运动轨迹。
  • 3.实时实例分割:预估每个球员用于深度预估网络的分割掩码,借助语义分割和前一步的姿态估计。
  • 4.网格生成:将上一步的前景掩码与原始裁剪图像混合,放入一开始预先训练好的神经网络中进行训练。
  • 5.形成3D轨迹:减少相机位置和边界框定位时不精确带来的球员抖动,对3D球员轨迹进行平滑处理。

一连串操作至此,3D合成大功告成。

研究人员将此模型的3D生成结果与原视频和不同方法合成的结果进行了对比。

Youtube视频上真实处理结果

渲染后得到最后的效果图:

Youtube视频帧(最上一行)及渲染结果(第2~4行)

毫无疑问,这种方法可以得到更精确和完整的深度估计,重建的效果也最好。

美中不足

虽然场景不错,但这项技术目前并不完善,还不能让你随心畅看。

Bug 其实很明显,刚在观看效果的时候,各位有没有看见足球?

——冇。

没错,目前这套系统最大的问题就是还没有对足球进行处理,球的轨迹无法渲染出来,场上一票球员如同在踢“空气球”。

此外,系统对球员及守门员的(位置)把控不够准确,被遮挡的球员显示不完整。这就导致球员有时球员会突然消失,然后突然出现,犹如习得传送大法。

迷离消失的守门员

在论文中,研究人员表示,目前这项技术还在不断改进和升级中,下一部的计划是:

  • 改善画面重建的品质
  • 实现实时3D重建
  • 预估足球的位置
  • 让这项技术也能用于其他运动,让篮球、橄榄球、排球等等运动的球迷也能同此待遇。

华盛顿大学出品

这项研究的论文Soccer on Your Tabletop发表在CVPR 2018上,作者有四,均属于华盛顿大学(张亚勤母校)的GRAIL lab实验室,分别为Konstantinos Rematas、Ira Kemelmacher-Shlizerman、Brian Curless和Steve Seitz.

一作Konstantinos Rematas

如果觉得这项研究和你胃口,可移步传送门深入挖掘。

论文地址:

http://grail.cs.washington.edu/projects/soccer/soccer_on_your_tabletop.pdf

代码地址:

https://github.com/krematas/soccerontable

最后,效果视频长这样:

视频内容
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-07-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 3D转换的秘笈
  • 重建3D球赛,Go!
  • 美中不足
  • 华盛顿大学出品
相关产品与服务
云直播
云直播(Cloud Streaming Services,CSS)为您提供极速、稳定、专业的云端直播处理服务,根据业务的不同直播场景需求,云直播提供了标准直播、快直播、云导播台三种服务,分别针对大规模实时观看、超低延时直播、便捷云端导播的场景,配合腾讯云视立方·直播 SDK,为您提供一站式的音视频直播解决方案。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档