首页
学习
活动
专区
工具
TVP
发布

音视频技术

专栏作者
1271
文章
1362973
阅读量
286
订阅数
音频品鉴与歌唱评价——音频内容理解实践
歌唱评价是K歌系统中核心技术之一。近年来,歌唱评价领域也发生着多元化和深度化的变革。本次LiveVideoStackCon 2022 北京站邀请到腾讯音乐天琴实验室高级研究员——江益靓,为大家介绍全民K歌的多维度评价技术和深度歌唱评价技术的实践,以及优质内容挖掘中使用的音频品鉴系统。 文/江益靓 编辑/LiveVideoStack 各位同行朋友们,大家好,很高兴和大家一起分享交流,本次分享的主题是音频品鉴与歌唱评价——音频内容理解的一些技术实践。我是来自天琴实验室的益靓。 接下来将从四个方面展开介绍:歌唱
LiveVideoStack
2023-05-18
9030
#求职者联盟@多媒体技术人才
基于音视频服务和产品使用场景、需求的变化,多媒体行业过去一段时间内经历了飞速发展的阶段,但转过头来看2023年,在爆发增长过后,相关产业正普遍慢下脚步,寻求更多创新突破,发现新一轮的增长机会。对于企业来说,重细节、成本,寻求创新,需要更多高端人才的支撑;对于个人从业者来说,提升技术与能力,寻求更具成长与发展空间的工作和机会无疑是难上加难。 最近一段时间,也有一些同学或企业找到我们,希望通过我们来寻找工作机会,或招聘合适的人才。在深思熟虑过后,尽管我们不能直接地提供招聘相关的服务,但我们愿意提供一个平台或是
LiveVideoStack
2023-05-18
1990
要不要和我们一起看看音视频技术未来的模样?
▲扫描图中二维码或点击“阅读原文” ▲ 直通LiveVideoStackCon 2023上海站九折优惠 2023年5月11日,Google I/O年度开发者大会完美落幕。随着PaLM2模型发布、Bard的自由访问,技术彻底迎来了“AI 时代”。 但今天我们想聊的并不是AI,而是一直支持AI发展的音视频技术。 我很喜欢I/O这两个字母的含义:它代表Input与Output(输入与输出),是计算机系统与世界交互的基础行为。我想,这也能很好的代表我们LiveVideoStackCon的大会。在会场上,有人扮演
LiveVideoStack
2023-05-18
7300
【今晚7点】元宇宙直播的终端架构设计和关键技术
点击上方“LiveVideoStack”关注我们: 互娱类直播产品经历过秀场直播、互动直播发展至今,产品形态上逐步见顶,探索新的互动方式成为主流直播平台新的风向标。2021年开始,『元宇宙』凭借其独特的新特征逐步进入直播领域。元宇宙+直播这种全新的融合方式成为时下互娱类直播新的突破口。 今晚 7:00,我们邀请到了百度智能云视频云资深研发工程师 李明路老师围绕终端引擎技术发展与演进,详细介绍元宇宙直播技术体系、终端架构设计和关键技术,分享百度智能云在元宇宙直播场景中的实践探索。 演讲嘉宾: 李明路 百
LiveVideoStack
2023-05-18
2440
AV夜话11:关于多媒体人才的现状
▲扫描图中二维码或点击阅读原文▲ LiveVideoStackCon 2023上海正在招募讲师,扫码或阅读原文了解信息 今年3月31日-4月1日北京的LiveVideoStackCon成为参与人数最多的一次,但这并没有证明多媒体生态蒸蒸日上,反而正面临发展减速,不断寻找新的增长点,多媒体生态从业者也面临比较艰难的日子。一名服务于一线科技公司的猎头职员告诉LiveVideoStack:“2023年相对2022收入下降了50%。”他还透露,“还有人才需求的客户从100多家下降到10多家,而且对候选人的要求更加苛
LiveVideoStack
2023-05-18
1850
音视频技术开发周刊 | 293
每周一期,纵览音视频技术领域的干货。 新闻投稿:contribute@livevideostack.com。 谷歌全面反攻 ChatGPT!PaLM 2、Gemini 双杀,Bard 正式开放 以上是2023 Google I/O 大会的重点内容,AI含量极高。 谷歌推拥有26000个H100的超算,加速AI军备竞赛 云提供商正在组建 GPU 大军,以提供更多的 AI 火力。在今天举行的年度 Google I/O 开发者大会上,Google 宣布了一款拥有 26,000 个 GPU 的 AI 超级计算机—
LiveVideoStack
2023-05-18
4280
快速落地基于“AIGC+数字人”的数字化内容生产
谁不想有一个可爱的数字人形象呢?在日常的工作和娱乐中,越来越多的数字人虚拟形象与大家见面,他们可以是主播,也可以是语音助手,还可以是你自己的虚拟宠物。只有更快更精准的生成数字人,才能让数字人更加普及,普通消费者才能更多地接触到数字人。LiveVideoStackCon 2022北京站邀请到了张瑞全老师为我们分享美摄科技的数字人技术。 文/张瑞全 编辑/LiveVideoStack 大家好,我是来自美摄科技研发中心的高级AI算法专家张瑞全。今天分享的主题是美摄科技关于快速落地基于“AIGC+数字人”的数字化内
LiveVideoStack
2023-05-12
9230
AV夜话#10 于昕:聊聊GPT与智能问答
▲扫描图中二维码或点击阅读原文▲ LiveVideoStackCon 2023上海正在招募讲师,扫码或阅读原文了解信息 上周五,与北京理工大学的王晶老师交流了音频技术的机会,我们聊到了许多有趣的话题。比如几年前被寄予厚望的AI音频Codec在工业界落地的情况并不好,原因既有鲁棒性问题,也有现有终端算力问题。还比如音频人才的就业现状,答案是还不错,尤其有高水平的应届生依然很抢手。当然还重点交流了音频技术的新的应用场景或行业,我们聊到了车载或者叫智能座舱,助听设备,音频质量评价,以及国内重点城市的生态,甚至国内
LiveVideoStack
2023-05-12
3340
RTC 体验优化的“极值”度量与应用
随着线上互动需求的增加,直播连麦、语音/视频聊天的应用越来越广泛。我们一直在说“追求用户的极致体验”,但是体验是一个抽象的概念,很难量化和统计。如何从用户的行为中得到所在场景的优化“极值”,如何依据“极值”建立统一的质量指标体系以指导业务优化?如何迁移抖音的服务经验,满足toB用户的体验需求?LiveVideoStackCon 2022北京站邀请到火山引擎RTC团队负责人——杨智超,为大家介绍在实时通信场景下火山引擎RTC对体验的理解与应用落地。 文/杨智超 编辑/LiveVideoStack 大家好,本次
LiveVideoStack
2023-05-12
4180
【公开课预告】元宇宙直播的终端架构设计和关键技术
点击上方“LiveVideoStack”关注我们: 互娱类直播产品经历过秀场直播、互动直播发展至今,产品形态上逐步见顶,探索新的互动方式成为主流直播平台新的风向标。2021年开始,『元宇宙』凭借其独特的新特征逐步进入直播领域。元宇宙+直播这种全新的融合方式成为时下互娱类直播新的突破口。 5月16日 19:00,我们邀请到了百度智能云视频云资深研发工程师 李明路老师围绕终端引擎技术发展与演进,详细介绍元宇宙直播技术体系、终端架构设计和关键技术,分享百度智能云在元宇宙直播场景中的实践探索。 演讲嘉宾: 李
LiveVideoStack
2023-05-12
2390
云剪辑-B端在线剪辑⼯具架构设计与演进
腾讯云音视频的云剪辑致力于让客户在自己的应用(Web、小程序)中快速集成剪辑能力,同时强大的模板能力能够极大地提升视频生产效率。我们在探索B端在线剪辑产品的过程中遇到不少挑战:如何满足快速与定制两种集成场景?如何设计通用、高性能、可灵活拓展的渲染引擎?如何保证云端视频合成的效率与质量?LiveVideoStackCon 2022北京站邀请到了成锐林老师为我们分享他们团队是如何解答这一系列问题的。 文/成锐林 编辑/LiveVideoStack 大家好,我叫成锐林,是腾讯云智能创造平台云剪辑模块的负责人。今
LiveVideoStack
2023-05-12
1.2K0
ProRes Codec、浅压缩与产品经理
▲扫描图中二维码或点击阅读原文▲ LiveVideoStackCon 2023上海正在招募讲师,扫码或阅读原文了解信息 对于苹果或者摄影与后期重度用户应该了解ProRes吧,这是一种苹果私有的视频编解码标准,其提供卓越的图像质量与可观的压缩比,支持实时编辑应用,因此主要用于高质量的视频后期处理等场景。换句话说,ProRes在保证还原真实世界的数据信息前提下,提供了高速的压缩与解压缩能力,而获得的数据压缩收益也很可观。简而言之,这是一种“浅压缩”。 “浅压缩”正是我想说的,他可以付出很有限的算力,获得相当不错
LiveVideoStack
2023-05-12
2460
“玲珑”编解码融合架构助力视频多元化需求
随着近年来 AI 技术的兴起,视频监控、汽车、智能家居、移动设备及数据中心等对高清视频处理有了越来越高的要求。安谋科技全新视频处理器——“玲珑”V6/V8,针对主流市场的视频流媒体技术进行了大量投入,通过一系列智能权衡实现了极大优化,为所有合作伙伴提供灵活的组合和选择。LiveVideoStackCon 2022北京站邀请到了安谋科技多媒体产品经理董峰,为我们分享“玲珑”编解码融合架构助力视频多元化需求。 文/董峰 编辑/LiveVideoStack 此次是安谋科技在LiveVideoStack大会的演讲
LiveVideoStack
2023-05-12
4470
音视频技术开发周刊 | 292
每周一期,纵览音视频技术领域的干货。 新闻投稿:contribute@livevideostack.com。 谷歌将 AI 芯片团队并入云计算部门 追赶微软和亚马逊 OpenAI推出的ChatGPT获得一定成功,微软是OpenAI的重要投资者,它将ChatGPT植入必应搜索,威胁到谷歌搜索地位。谷歌将会整合旗下两个AI研发实验室DeepMind和谷歌Brain,以增强公司AI部门实力。 几行代码,GPT-3变ChatGPT!吴恩达高徒、华人CEO震撼发布Lamini引擎 Lamini的开发团队表示,你需要
LiveVideoStack
2023-05-12
3970
LiveVideoStackCon 2023上海站 专题评审团招募正式启动
一路走来,专家评审团已经和LiveVideoStack联手两个年头了。从第一次小心翼翼的尝试,到后来越来越多的惊喜涌现,我们逐渐意识到,评审团已经成为了大会中不可或缺的一环。每一场干货满满的演讲背后,不仅有讲师的默默耕耘,还蕴藏着评审团成员们不厌其烦的修改建议,成就了一次又一次的高质量大会。 因此,我们想在文章中正式邀请技术人们加入进来,组建本次的LiveVideoStackCon2023上海站大会评审团。 即日起-5月26日,LiveVideoStackCon2023 音视频技术大会 上海站 专题评审
LiveVideoStack
2023-05-12
3480
QQ音乐银河音效技术实践——音乐重放效果的补偿与修饰
音效渲染是音频或音乐播放器最为重要的后处理模块之一。LiveVideoStackCon 2022 北京站邀请到腾讯音乐银河音效开发负责人——闫震海,为大家介绍银河音效在QQ音乐播放器中的创新应用,包括空间环绕效果和音效制作工具等内容。 文/闫震海 编辑/LiveVideoStack 大家好!很高兴和大家一起分享交流关于QQ音乐银河音效的一些技术实践。 相信大家对音效处理都不陌生。它已经被广泛应用在各种音频信号、音乐信号的渲染场景中。本次分享重点是音乐重放场景,如何利用音效对最终听到的感觉进行补偿和修饰。
LiveVideoStack
2023-05-05
9550
AV夜话#9 王晶:聊聊音频技术与产品创新
▲扫描图中二维码或点击阅读原文▲ LiveVideoStackCon 2023上海正在招募讲师,扫码或阅读原文了解信息 上周五,与海蜂法务、海蜂坤行的联合创始人王莹交流了GPT在法律行业的机会。首先行业基本认为大模型加行业小模型的方式可行,但要在法律行业落地需要解决好数据安全和隐私问题。第二,在大模型成熟之前,法律行业就在探索自动化的提供法律服务的可能,比如法务咨询机器人等。直到大模型成熟后,行业开始加速探索。第三,GPT在法律行业的落地需要解决信用和成本问题。知名律所和知名律师更容易取得客户的信任,相比之
LiveVideoStack
2023-05-05
2120
动效素材极速交付: 腾讯PAG动效组件技术揭秘
编者按:音视频产品中的动效素材需求是源源不断的,例如贴纸花字,转场特效,照片和视频模板等,并且对它们的产量,上线速度,以及视觉效果都有比较高的要求。但在传统工作流中的交付成本却非常高,需要通过代码来手动还原设计师预设的动效内容。为了降低或消除动画相关的研发成本,腾讯内部历时 5 年研发了一套 PAG 动画工作流的解决方案,能够一键将 AE 动画内容导出并应用到几乎所有的主流平台。LiveVideoStackCon 2022北京站邀请到了腾讯媒资产品中心副总监陈仁健,为大家系统地分享在产品需求的驱动下,PAG
LiveVideoStack
2023-05-05
1.3K0
消除动效研发成本:腾讯 PAG 动效解决方案
本文作者 陈仁健,腾讯 OVBU 媒资产品中心副总监,曾主导过开源 UI 框架 FlexLite 与 Egret 游戏引擎的设计研发。2018 年加入腾讯,作为腾讯多媒体技术委员会下 AVGenerator Oteam 核心 PMC 成员,持续专注在音视频编辑、图形图像特效、C++ 跨平台渲染等领域。主导研发的中台组件 PAG 动画解决方案已接入服务了 400+ 应用,包含微信、QQ、王者荣耀、小红书等头部 App,并于 2022 年 1 月正式对外开源。 T Chat|我在大厂做研发 系列直播第 16 场
LiveVideoStack
2023-05-05
1.2K0
音视频技术开发周刊 | 291
每周一期,纵览音视频技术领域的干货。 新闻投稿:contribute@livevideostack.com。 谷歌将 AI 芯片团队并入云计算部门 追赶微软和亚马逊 OpenAI推出的ChatGPT获得一定成功,微软是OpenAI的重要投资者,它将ChatGPT植入必应搜索,威胁到谷歌搜索地位。谷歌将会整合旗下两个AI研发实验室DeepMind和谷歌Brain,以增强公司AI部门实力。 Google DeepMind最新研究:如何将人类价值观融入AI? 政治哲学家 John Rawls 在《正义论》中探讨
LiveVideoStack
2023-05-05
4850
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档