一、案例概述
2023年7月20日,中央广播电视总台联合上海人工智能实验室打造了“央视听媒体大模型”(以下简称“央视听大模型”),以海量视听数据和深度专业知识为驱动,利用原创先进算法和超大规模算力进行训练,赋能视听节目创作、智能剪辑等多方面。
图:央视听媒体大模型
二、实现方式
“央视听媒体大模型”是首个专注于视听媒体内容生产的AI大模型,集合了中央广播电视总台的海量视听数据与上海AI实验室的原创先进算法、大模型训练基础设施优势。
目前,“央视听媒体大模型”具备了强大的视频理解能力和视听媒体问答能力,可根据提供的视频创作文字——从主持词到新闻稿件,甚至诗歌。当前生成内容已覆盖美食、文化和科技等多个领域。
“央视听媒体大模型”可通过逐步呈现的视觉元素,理解并分析视频。用户通过与AI聊天对话的形式,深挖视频蕴含信息,进一步完善输出的内容。该大模型还为用户提供了强大的交互式图像、视频编辑与创作能力,用户仅需使用简单的光标和文字指令,即可快速修改或编辑图像,实现“指哪改哪,画随口出”。
具备超强理解能力的同时,“央视听媒体大模型”还拥有通用的生成能力,即通过文本直接生成视频。同时具备快速生成“数字人主播”的能力,使用较短的真人采集视频即可生成对应的数字人,不仅能根据既定文案和背景场景快速生成播报视频,还可自动学习真人的语言及动作习惯,做到形象更逼真,表情更自然。
三、主要成效
在提高生产效率、优化内容创作、拓展创意空间上,“央视听媒体大模型”提供了更加高效的智能创作工具,提升视听媒体制作的质量和效率。
四、社会评价
“央视听媒体大模型”将拓展视听媒体的创意空间、提高创作效率并带来交互方式的变革。(新民晚报)
领取专属 10元无门槛券
私享最新 技术干货