前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >音视频技术开发周刊 | 225

音视频技术开发周刊 | 225

作者头像
LiveVideoStack
发布2021-12-21 17:42:05
6820
发布2021-12-21 17:42:05
举报
文章被收录于专栏:音视频技术音视频技术

视觉体验在全真时代显得越发重要,如何提高用户的视觉体验?更好的编码标准带来的低码率高画质、超分等视频处理手段带来的画质提升、三维视频带来深度感知、任意视点视频或者VR360视频带来的用户交互、扩展现实与虚拟现实带来的超现实感;另一方面,智能时代革新了音视频技术,通过音视频分析更好的理解数据与连接用户、通过辅助创作让音视频内容极大丰富。LiveVideoStack2021北京站邀请到腾讯多媒体实验室视频技术总监—李松南,带领我们一起发掘在全真时代与智能时代里多媒体技术的无限可能。

使用 MediaCodec 进行视频的编码和解码

在Android中播放视频很简单,只要创建一个MediaPlayer实例,然后设置上DataSource和SurfaceView就可以了。但是播放视频还有一种方式就是使用Android提供的MediaCodec,它可以用于编码和解码。另外如果要播放使用Android Widevine加密的视频则必须使用MediaCodec来完成解密和解码的过程。

不仅仅是大量传感器和摄像头,谷歌Starline 3D视频方案解析

近期,谷歌实验室公布了该项目背后的技术细节,包括采用的摄像头、红外传感器等硬件,以及如何在测试过程中,通过精准的视觉模拟来欺骗用户的观感。简单来讲,Starline可以看做是一种专为面对面会议设计的双向3D电话亭,它可以实时扫描使用者的3D形象,然后在另一端的光场显示器上实时呈现立体的视频图像,这种立体视频裸眼可观看,无需额外的头显。此外,声音也以3D空间音频形式呈现,通话者的注视点也会实时追踪和更新,看起来足够真实。

使用 JPEG XS 和 AWS CDI 的云端实时视频

本次演讲主题为使用 JPEG XS 和 AWS CDI 的云端实时视频,主讲人为来自亚马逊云科技专门从事广播的首席解决方案架构师 Thomas Edwards。他从 JPEG XS 和 AWS CDI 两个方法分别进行了介绍。

从直播硬件出发,浅析直播技术到物联网设备的智能化趋势

直播有个人直播(泛娱乐直播)和企业直播(商业&商务直播)之分;个人直播的投入成本低,一部手机便可以随时随地开播,且各直播App有足够多的直播辅助工具来协助开播,对增值服务需求不高;企业直播讲究规范,有专门的直播间,投入的人力物力很大,直播影响面广泛,对专业的直播硬件,PaaS,SaaS等软件服务以及运营指导,售后服务等多种增值服务都有明确诉求,故本次分析基于TO B的企业直播业务展开。

视频直播关键技术和趋势

移动互联网的兴起为人类信息传播带来了更便捷的通道、更立体的视角和更丰富的选择。视频直播等多媒体通信技术在新的时代背景下逐渐崭露头角并不断渗入到人们的日常生活中,以提高人们的信息传输效率、降低信息传输成本。

无线声学传感网络中的采样率失配问题怎么办?

无线声学传感器网络是一个集信息提供、感知、传送和处理为一体的有机整体,通常包括多个声学传感器节点。其中,每一个传感节点都是具有一定感知、计算和无线通信能力的设备。这些节点通过自组织的形式形成无线声学网络系统,协作收集数据并进行处理。相比于我们熟知的传统麦克风阵列,无线声学传感网络的麦克风节点可以放置到更加灵活的位置,这也增加了声源附近有多个麦克风存在的概率,可以收集到更高质量的信号。而且由于所有具有收发功能的记录设备(如个人手机,电脑等)都可以作为记录节点,因此无线声学传感网络的搭建相当容易,它在音频采集和处理领域有着很好的应用前景。

技术实战 —— 快速实现语聊房搭建

语音相比文字图片更丰富,比视频又更简便,是天然的社交工具。以95后为代表的Z世代用户,在微信、QQ、微博等主流社交工具以外,更愿意尝试基于不同兴趣相对小众的社交工具。ZEGO 即构科技推出语聊房解决方案,帮助客户快速搭建语聊房。本次分享,我们邀请到了 即构科技交付解决方案专家 JIN 。他向我们分享了线上社交以及语聊房的发展、玩法,并详细解析如何快速搭建语聊房,提供稳定、低延时,高品质的线上互动体验。

MIT、哈佛新研究:提速15000倍,借助光场实现3D场景超高速渲染

在一篇 NeurIPS 2021 论文中,来自哈佛大学、麻省理工学院的研究人员提出了一种新方法,使从图像中表征 3D 场景比已有模型约快 15000 倍。该研究提出的光场网络 (LFN) 可以在仅对图像进行一次观看后重建光场,并且能够以实时帧率渲染 3D 场景。

视频精修一帧要花2小时?美图影像研究院的AI只要5.3毫秒!

围绕用户更具个性化的「变美」 需求,美图影像研究院(MT Lab)自研基于深度学习的实时视频美容方案。通过设计轻量的神经网络生成式模型,结合强大的美图AI推理框架(Manis)和千万级人像图库训练优势,实现对动态视频人脸的瑕疵修复与暗沉祛除,同时最大程度地保留了皮肤的真实纹理细节。

人类驾驶,交通事故的最大Bug | 产学研联合发布自动驾驶汽车交通安全白皮书

商业落地,这是今年自动驾驶行的关键词。年末晒成绩之际,百度、中汽中心、同济大学却联合公布了这样一份报告:《自动驾驶汽车交通安全白皮书》。这份聚焦自动驾驶道路交通安全的报告,还是产学研联合出品,有车,有路,也有政策和技术。今年,自动驾驶公司各显神通,商业化落地进展迅速。此时强调自动驾驶的安全,又有何深意?普通人对于自动驾驶最大的担忧,《自动驾驶汽车交通安全白皮书》(下称《白皮书》)又给出了哪些解答?

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-12-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 LiveVideoStack 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
图像处理
图像处理基于腾讯云深度学习等人工智能技术,提供综合性的图像优化处理服务,包括图像质量评估、图像清晰度增强、图像智能裁剪等。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档