Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >【线上圆桌整理 - 腾讯会议】进化中的视频会议

【线上圆桌整理 - 腾讯会议】进化中的视频会议

作者头像
LiveVideoStack
发布于 2021-07-30 03:59:31
发布于 2021-07-30 03:59:31
2.9K0
举报
文章被收录于专栏:音视频技术音视频技术

本次分享将聚焦在进行中的视频会议,针对视频会议新技术做探讨。视频会议不是单纯的编解码和网络传输应用,它背后的数据支撑以及新能力引入都会带来新的可能和机遇。本次演讲邀请到腾讯会议产品部网络技术组许景禧分享腾讯会议最近在网络质量分析方面的工作(本文略过),以及探讨近期热门的光场会议,与大家交流视频会议潜在的进化方向。

内容源自腾讯会议产品部高级研究员 许景禧在视频会议下半场圆桌上的分享。

我是来自腾讯会议产品部网络技术组许景禧。本次想与大家讨论视频会议方面最近有哪些新的技术有可能落地。

我们今天会聊一下最近比较感兴趣的视频会议新形式——光场会议,希望可以抛砖引玉与大家做讨论。光场会议主要会讨论其核心模块,目前使用相关技术有哪些种类?

1

腾讯会议关注行业前沿

1.1 先进视频技术

事实上,腾讯会议一直关注业界和学术界的新进展,落地了大量前沿技术,例如提高共享屏幕高保真度的特殊YUV4:4:4编码,“Tencent Screen Encoder” TSE技术,还有喜闻乐见的虚拟背景、美颜方面技术。

1.2 优秀音频体验

值得一提的是腾讯会议在音频方面花了很大力气,设立了专门的天籁实验室,投入大量研发,推出超宽带语言的编解码器、智能降噪、回音检测消除技术。我们最近还推出腾讯会议天籁模组给合作伙伴,让他们结合自己的硬件实现,提供与腾讯会议一样高质量拾音能力。

2

依托腾讯云 腾讯会议助力企业协作转型

目前腾讯会议在全球超过一百多个地区上架海外版,让企业与全世界各地的人做实时音视频会议交流。

3

更多客户选择

大量政府企业、教育企业已经使用了我们的产品,同时我们也保证了很多重要会议的召开。我们致力于持续增加腾讯会议的稳定性以及极端网络抗性。

4

企业运营管理平台

腾讯会议有大量企业用户,对内部会议有较高要求,需要为它提供完整的管理工具和问题定位系统,让企业IT方便了解整体资源消耗,查看目前会议进行状态,或让企业会服在不参与会议情况下配置会议相关细节阐述。

5

新一代的视频会议探讨——光场会议

腾讯会议一直关注着最新技术进展,因为我们知道新技术都有为客户提供更好会议体验的潜力。最新关注的光场会议是比较热门方向,这里我们分享一些观察和看法。

说到光场会议,大家首先想到的是Google Starline项目,系统比较大的卖点是做到让参会者有共处一室的体验,最关键的一点是,让多个参会者能在多个不同角度看到远程会人的不同侧面。

5.1 显示

此技术最让人关注的点是,远端参会者是通过什么方式在本地展示出三维效果的,所以我们优先讨论这点。事实上,有很多技术可以实现这一点。例如我们可以通过佩戴VR/AR设备,如Valve Index,或者是微软的Hololens,看到参会者虚拟形象。又或者,如果不想佩戴此种设备就直接看到三维的效果,SONY有硬件可以通过追踪人眼观察角度让用户看到画面多个角度:从这边看,就显示这边的视角;从另一边看,就显示另一边的视角,进而感受到三维效果。如果想要像Google Starline一样,能让多个人同时观看到三维效果,那就需要用到光场显示器。比较有代表性的是Looking Glass 8K这个设备。

5.2 多人同时观看多角度显示器

LookingGlass厂商设备具体怎么做的呢?事实上这个技术看起来很高深,但本质很简单:每个像素提供45个观看角度,当用户从相应角度观看就可以看到相应画面。45个角度其实是45个不同的画面,将这些画面按一定顺序输入至设备上,就可以如右下角那样,摇摆显示器就能看到不同的侧面。事实上,这里有45个不同角度的视频在同时显示。不同厂商有不同实践形式,LookingGlass应该是使用棱镜的形式,还有一些会采用纳米膜。不同厂商的设备提供的可视角度会有一定区别。Looking Glass 8K这个产品只能从水平50度角的范围内,平分成45个角度观看,上下移动时是不能看到对方的头顶的,这点和Google的演示还有点类似。我们觉得Google有可能会用类似技术的硬件做展示,但也留意到Looking Glass暂时没有这么大尺寸的显示器,这里推测他们用的是定制设备。

5.3 采集

那我们怎么提供这45个视角的视频呢?最简单的方式,就是用扇形排布的45个摄像头拍摄人物,并将得到的45个角度视频实时传到硬件上,这样就可以完成最粗暴的光场会议。这里可能会存在一些问题,如摄像头要怎样做标定和同步。同时,传输45个视频虽然不是不能做到,但还是比较浪费带宽。Google有篇论文(上图左下角)讲到它如何通过摄像头阵列做到类似事情,感兴趣的同学可以看一下如何减少摄像头的数目做到同样效果。

看回Google Project Starline的宣传图片,它的上下方看起来都有摄像头阵列。我们猜测它的本质还是用这种多摄像头整列做重建。

5.4 重建

事实上,有三种不同的方式做重建。

一是采用虚拟人或者是Avatar的形式(如左上腾讯虚拟人)。用虚拟人可以事先采集人的整体特征,建立模型,再在实时会议上把人的动作表情映射到虚拟人上。缺点是要做大量前处理工作,用起来不方便。

二是零几年到一几年一直流行的“点云”以及面重建技术(右上)。微软对这一技术有很多研究,也有消息说微软的Holoportation团队出来创业后被Google收购了,所以Google也是可能用到类似技术的。

三是最近比较新的基于深度学习的多视角合成技术。多视角合成(左下)技术认为我们采集和传输45个视角太多了。事实上只需要用少量的,例如12个视角,通过一些方式生成剩下视角,就可以重建出这45个视角。这个技术的好处是泛用性较好,比较有代表性的是一个叫NeRF的工作,相关论文讲到如何能通过神经辐射场做到这点。然而,采用该论文的方案,在我们的测试环境上,每次更换场景和人员的时候都需要进行7-8小时的训练,渲染一帧图像也要用超过1分钟的时间,很难在实时会议中落地。在新一点的论文上,会有增加泛用性的一些方案,可以做到场景更普适,渲染时间更短,各位可以留意一下相关的进展。

以上是三套不同的方式来做的重建方案。这边目前不确定Starline用的是哪种方案,也许是三者兼有,欢迎各位讨论。目前比较明确的只有光场显示器是必需品。

以上就是我的全部分享,谢谢大家。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-07-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 LiveVideoStack 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
腾讯会议又一黑科技,屏蔽超过 200 种会议噪声是如何做到的?
作者 | 伍杏玲 出品 | AI 科技大本营(ID:rgznai100) 远程会议已成为我们常规的工作沟通方式,在线交流打破时间、空间的限制,给予我们便利之际,也屡遭尴尬: 忘记静音,一边听会一边敲键盘,被对方提醒:“XX,麻烦静下音”; 自己正在讲话呢,身旁人走来走去有噪音,影响会议收听效果,你恨不得马上转移开会阵地…… 后疫情时代,远程会议有以下发展趋势:远程协作占员工的工作时间50-80%,线上线下混合会议将超过90%,视频会议功能将成为大部分会议的标配。因此提高远程会议的交互体验已成为厂商迫在眉睫的
AI科技大本营
2023/05/08
2K0
腾讯会议又一黑科技,屏蔽超过 200 种会议噪声是如何做到的?
5年秘密研发!谷歌3D「魔镜」实测,真人聊天不用「抱脸虫」
如果你平时用惯了skype或者zoom,第一次见到starline时,你一定会大吃一惊。
新智元
2023/01/06
6700
5年秘密研发!谷歌3D「魔镜」实测,真人聊天不用「抱脸虫」
2021如何选会议产品?四款线上视频会议软件测评揭晓
在全球新冠肺炎肆虐之际,受居家隔离政策的影响,视频会议成为人们工作生活的新选择,也让大多数人认识到在线会议对于未来的重要性。
云巴巴
2021/08/31
4.2K0
2021如何选会议产品?四款线上视频会议软件测评揭晓
谷歌最新黑科技:裸眼3D视频通话,宛如真人面对面!Jeff Dean:魔镜啊魔镜
这个名为Starline的3D视频通话技术,让屏幕另一边的人看起来有体积、有深度和阴影,就像坐在你的面前一般真实。
量子位
2021/06/17
9160
音视频技术在云会议场景的拓展和未来
大家好,我是腾讯天籁实验室负责人、资深专家研究员商世东。非常荣幸能够在LiveVideoStackCon 2021音视频技术大会上海站现场为大家分享,过去两年我们通过腾讯会议探索音视频技术在云会议场景下的应用所收获的经验与心得,以及音视频技术在腾讯会议中的使用情况。基于此,我们进一步探索音视频技术在云会议场景下的未来。本次分享将从以下五个方面展开:
LiveVideoStack
2021/04/20
2.1K0
视频会议未来趋势不完全预测
根据Frost&Sullivan的最新研究,目前,全球已经有41%的雇主提供远程工作,60%的雇主允许员工自行设定工作时间和地点。
用户7118337
2020/04/14
7060
空间音频在视频会议场景中的应用
编者按:空间音频(Spatial Audio)在影院、游戏、虚拟现实、舞台录音等场景中得到了广泛的应用,它提供给用户更加接近于真实的听觉感受。空间音频的实现方式有多种,常见的有基于心理声学原理、基于物理声场的重构、和基于双耳音频的精确重放。在人与人的交流沟通场景中,人的双耳听觉对于在嘈杂环境下语音信息的提取和理解起到关键的作用,对提升交互体验和提升有非常大的帮助,但是到目前为止空间音频在远程视频会议沟通场景中的应用还非常少。本次LiveVideoStackCon 2022 上海站邀请到了广州迈聆信息科技有限公司的的李勤老师,一起探讨空间音频在视频会议场景中应用的技术挑战和实现方式。从系统的角度探讨如何在视频会议中提供给用户更好的听觉体验。
LiveVideoStack
2023/01/10
1.5K0
空间音频在视频会议场景中的应用
您的业务真的需要视频会议,五百强企业推荐使用—zoom云视频会议
疫情之后可以说是视频会议的高速发展期,特别是平时经常性开会的小伙伴们,是不是已经对视频会议软件熟的不能再熟了。视频会议对任何业务来说都是必需的,它不仅降低旅行成本,而且还能让企业更好的被合作伙伴和客户访问。
云巴巴严选云
2021/07/29
2.4K0
您的业务真的需要视频会议,五百强企业推荐使用—zoom云视频会议
视频会议未来趋势不完全预测
根据Frost&Sullivan的最新研究,目前,全球已经有41%的雇主提供远程工作,60%的雇主允许员工自行设定工作时间和地点。
LiveVideoStack
2020/03/12
2.8K0
腾讯会议SaaS SDK特性更新列表
2、多语言翻译:支持17种语言翻译,在会议中的字幕、实时转写以及会议后的录制页中均能使用,开启翻译。
腾讯会议
2023/06/20
5.3K0
3D视频会议系统VirtualCube:相隔万里也如近在咫尺般身临其境
来源:微软亚洲研究院本文共3000字,建议阅读10分钟确认过眼神,是沉浸式的会议体验。 编者按:常言道:“眼睛是心灵的窗户”,眼神交流所传达的信息也可以进一步提升人们的沟通效果。然而,随着视频聊天、视频会议逐渐成为常态,大家不禁要问,我们有多久没有与同事、朋友、家人确认过眼神了? 而微软亚洲研究院的研究项目 3D 视频会议系统 VirtualCube,可以让在线会议的与会者建立自然的眼神交互,沉浸式的体验就像在同一个房间内面对面交流一样。该技术的相关论文被全球虚拟现实学术会议 IEEE Virtual Re
数据派THU
2022/05/27
5090
3D视频会议系统VirtualCube:相隔万里也如近在咫尺般身临其境
道一云 X 腾讯会议 :首个打通线上线下的智能会议解决方案|腾讯SaaS加速器·案例库
来源 | 腾讯SaaS加速器首期项目-道一云 ---- 疫情期间,为了满足团队沟通的需求,不少道一云的客户纷纷尝试使用了像腾讯会议这样的在线会议系统,这种随时随地都能举行的会议形式相比传统线下会议更加高效,让不少企业管理者尝到了甜头。 而随着企业陆续复工,一种新的开会形式逐渐变成常态,一部分参会者在线下参会,一部分参会者通过在线方式接入会议,如何有效组织这种混合式会议,变成了一个新的课题。 为满足客户的使用需求,道一云第一时间完成了腾讯会议与会议助手的对接,形成了线上+线下同步开会的整体软硬件解决方案
腾讯SaaS加速器
2020/06/09
2.8K0
2024年面世!谷歌将发布首款AR头显,携裸眼3D「魔镜」布局元宇宙
据两位知情人士透露,谷歌最近开始加紧研发AR眼镜,内部代号为Project Iris,希望在2024 年上市。
新智元
2022/02/24
1.1K0
2024年面世!谷歌将发布首款AR头显,携裸眼3D「魔镜」布局元宇宙
2020,视频会议爆发元年
最近腾讯发布了Q3季度财报,营收与用户双双增长,而这其中最亮眼的增长一定是腾讯会议带来的。上线245天,腾讯会议用户数突破1亿,虽未盈利,但已启动商业化。
镁客网
2020/12/08
1.2K0
2020,视频会议爆发元年
如何把摄像机信号接入腾讯视频会议系统?
年末将至,各大型集团企业都在筹备召开年终总结会,由于受疫情影响,为了尽可能减少人员交叉接触,线上远程视频会议已经成为了各行各业线上办公、会议的首要选择。 目前,大部分视频会议系统在常规使用场景下,可便捷接入手机、电脑和其他H.323/SIP会议终端视频等,而对于前端是摄像机SDI/HDMI的视频信号,怎么接入到视频会议系统呢?
千视电子KILOVIEW
2021/01/13
23.9K0
如何把摄像机信号接入腾讯视频会议系统?
戴尔U3223QZ深度体验:生产力工具的多元进化
分辨率、刷新率、尺寸、亮度、色准、对比度、功耗等技术性名词,可能是大多数人给出的答案。就像“显示器”的字面意思,最直接的作用就是显示。场景再细分一些的话,办公、游戏、影音等不同需求,对显示器的偏好略有差异。
Alter聊科技
2023/01/12
3500
戴尔U3223QZ深度体验:生产力工具的多元进化
音视频技术开发周刊 | 225
视觉体验在全真时代显得越发重要,如何提高用户的视觉体验?更好的编码标准带来的低码率高画质、超分等视频处理手段带来的画质提升、三维视频带来深度感知、任意视点视频或者VR360视频带来的用户交互、扩展现实与虚拟现实带来的超现实感;另一方面,智能时代革新了音视频技术,通过音视频分析更好的理解数据与连接用户、通过辅助创作让音视频内容极大丰富。LiveVideoStack2021北京站邀请到腾讯多媒体实验室视频技术总监—李松南,带领我们一起发掘在全真时代与智能时代里多媒体技术的无限可能。
LiveVideoStack
2021/12/21
7080
音视频技术开发周刊 | 225
视频会议一体机的技术实践和发展趋势
作者 |  伟隆 钉钉蜂鸣鸟音频实验室 算法专家 在混合办公的常态趋势下,远程沟通协作的效率至关重要。然而,远程会议目前依然存在不少影响沟通的问题,比如缺乏会议室拾音和放音设备、软硬件设备不兼容、因远场拾音导致听不清等,这些问题都会消磨与会者的耐心,影响会议效果,让团队逐渐失去讨论的激情。 因此,无论是国外的微软、Zoom,还是国内的钉钉、腾讯会议,都在建立自己的硬件终端生态,期望通过硬件来解决线上、线下混合办公中的拾音问题,比如麦克风、音视频一体机、会议平板等。但即便如此,在线下开会时最常见的一个现象,依
深度学习与Python
2023/03/29
7180
视频会议一体机的技术实践和发展趋势
腾讯技术开放日 | 保障视频连线画质清晰且流畅,腾讯会议有这些优化实践
导读 | 腾讯会议自去年12月底推出,在疫情期间极速扩容,日活跃用户超过1000万。面对数量庞大的用户,以及他们背后网络、设备的多样性,该如何针对各个场景进行优化以提升用户体验?在【腾讯技术开放日 · 云视频会议专场】中,腾讯多媒体实验室视频技术专家王诗涛针对视频编码技术优化实践进行了分享,讲述如何利用视频技术达到清晰流畅,低延时的用户体验。 点击视频,查看直播回放 一、屏幕分享场景编码技术优化实践 在视频会议中,视频的应用场景分两部分:屏幕分享和摄像头视频。屏幕内容是由电子设备生成的图像,摄像头内容是
腾讯多媒体实验室
2020/05/28
2.5K0
思科Webex与下一代视频会议
视频会议在人们的日常生活中使用愈发频繁,尤其是在新冠肺炎疫情的影响下视频会议市场急剧增长,由此引发了思科网讯视频技术的不断更新。本次分享,我们邀请到了思科协作技术事业部的首席工程师Thomas Davies先生,他向我们分享了AV1的发展历程,开发AV1时所受到的挑战,以及AV2的发展前景及其在实时通信中的作用。
LiveVideoStack
2021/07/12
4450
思科Webex与下一代视频会议
推荐阅读
相关推荐
腾讯会议又一黑科技,屏蔽超过 200 种会议噪声是如何做到的?
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档