前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >央视春晚的元宇宙技术,微软发布AI声音生成工具VALL-E,百度将推出类ChatGPT风格机器人,2023WebRTC预测…

央视春晚的元宇宙技术,微软发布AI声音生成工具VALL-E,百度将推出类ChatGPT风格机器人,2023WebRTC预测…

作者头像
LiveVideoStack
发布2023-02-23 16:28:46
6630
发布2023-02-23 16:28:46
举报
文章被收录于专栏:音视频技术

 点击上方“LiveVideoStack”关注我们

▲扫描图中二维码或点击阅读原文▲

了解音视频技术大会更多信息

🐰正月十一,开工大吉🐰

以下均为节选内容,点击相关文字即可跳转原文

“硬科技”满满,盘点2023央视春晚的元宇宙技术

据报道,2023年春晚共有5个 AR 虚拟机位,是历届春晚中最多的一年,覆盖整个演播大厅。还首次在三维索道摄像机中加入 AR 技术,力求为电视机前的观众带来更加丰富的视听感受。其中涵盖的技术包括:AR+动作捕捉、AR+虚拟制片、VR绘画+AR互动、XR虚拟场景、AR+AI绘图。

▲网传苹果MR头显渲染图

让Siri打造“元宇宙”?苹果MR头显内容生态大起底

苹果MR头显要来了——紧跟而来的,会是MR内容生态爆发吗?

8K显示屏、64颗摄像头、双芯片设计......除了这些耳熟能详的苹果MR头显硬件爆料信息外,近日彭博社和科技媒体The Information接连爆料苹果在MR内容生态的布局,并且揭露了其多个内容“杀手锏”。

据悉,苹果MR内容开发项目主要由⼀个内部代号为Z50的秘密团队承担,该团队大约有几十人,其员工主要来⾃视频、游戏等⾏业。并且,苹果还在打造一款内容开发工具,希望让不懂编程的人也能通过Siri语音助手,构建自己的MR软件,并上线App Store。此外,苹果MR头显除硬件参数之外,还有一大秘密武器:MR内容生态布局。在这里,苹果将用一些新的玩法和技术创新,试图重新带动整个VR/AR行业。

百度将于3月推出类ChatGPT风格的机器人,嵌入到自家搜索服务中

据一位知情人士透露,中国搜索巨头百度计划推出与 OpenAI 的 ChatGPT 类似的人工智能聊天机器人服务,这可能是中国在这款现象级的科技产品引发的竞赛中最引人注目的参赛选手。

据要求匿名的这位消息人士表示,百度计划在今年 3 月份推出类似 ChatGPT 风格的应用,一开始会将其嵌入到公司的主要搜索服务中。这一工具的名称尚未确定,但它将会让用户获得对话式的搜索结果,就像 OpenAI 那个流行平台一样。

▲微软研究人员提供的VALL-E框图

微软发布AI声音生成工具VALL-E,只需3秒音频即可模仿人说话

近日,微软研究人员宣布了一种新的文本转语音AI模型,称为VALL-E,当给出三秒钟的音频样本时,它可以精确地模拟一个人的声音。一旦它学会了一个特定的声音,VALL-E可以复制说话者的情绪和语气,即使说话者本人从未说过的单词也可以模仿。

它的创建者推测,VALL-E可用于高质量的文本转语音应用程序、语音编辑,其中可以编辑一个人的录音并从文本转录中更改(让他们说出他们最初没有说的话),以及与其他生成AI模型(如GPT-3)结合使用时的音频内容创建。

Amazon Chime SDK 现支持 250 个网络摄像头视频流

Amazon Chime SDK 现支持每个 WebRTC 会话中使用最多 250 个网络摄像头视频流。Amazon Chime SDK 让开发人员能够在其 Web 和移动应用程序中添加智能实时音频、视频和屏幕共享。每个 WebRTC 与会者都可以启用网络摄像头视频,并查看来自其他与会者的最多 25 个网络摄像头视频流的任意组合。

开发人员可以根据每个会话参与者的角色为其创建量身定制的视图。例如,在一个在线学习应用程序中,教师视图可能包括一个包含 10 个学生的网络摄像头视频的面板,用于自动滚动浏览整个班级。学生视图可能专注于展示共享内容,但也留有专用空间用于显示来自教师、任何积极发言的学生及其若干好友的网络摄像头视频,由学生自行选择。

https://aws.amazon.com/cn/about-aws/whats-new/2023/01/amazon-chime-sdk-250-webcam-video-streams/

2023 年 WebRTC 预测

BlogGeek.Me近日发布了2023年的WebRTC预测,并基于WebRTC技术、WebRTC 中的开源、CPaaS和WebRTC等三方面进行全面解析预测。

https://bloggeek.me/webrtc-predictions-2023/


▼识别二维码或猛戳下图订阅课程▼

喜欢我们的内容就点个“在看”吧!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-02-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 LiveVideoStack 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • “硬科技”满满,盘点2023央视春晚的元宇宙技术
  • 让Siri打造“元宇宙”?苹果MR头显内容生态大起底
  • 百度将于3月推出类ChatGPT风格的机器人,嵌入到自家搜索服务中
  • 据一位知情人士透露,中国搜索巨头百度计划推出与 OpenAI 的 ChatGPT 类似的人工智能聊天机器人服务,这可能是中国在这款现象级的科技产品引发的竞赛中最引人注目的参赛选手。
  • 微软发布AI声音生成工具VALL-E,只需3秒音频即可模仿人说话
  • Amazon Chime SDK 现支持 250 个网络摄像头视频流
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档