前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >虚实之间01 | 什么是虚拟数字人?

虚实之间01 | 什么是虚拟数字人?

原创
作者头像
GIAIAC
发布2022-06-16 15:42:05
9700
发布2022-06-16 15:42:05
举报
文章被收录于专栏:虚实之间

《虚实之间》是广东人工智能与先进计算研究院公众号推出的关于虚拟数字人的专栏。研究院提供虚拟数字人从设计建模到驱动渲染智能交互全流程高效、高质量技术服务。

著名科幻小说《三体》描述过这样一个场景:主角为了寻找超自然力量的线索,借助虚拟现实设备进入了一款游戏,他在虚拟世界中遇到的人物,不仅有人类的外形,能跟他流畅地对话,甚至还有人类的逻辑和情感。

当然,即使到现在这样的游戏角色也仍然没有诞生,但十多年前小说家的幻想,也在逐渐成型。今天具有数字化外形的虚拟人物——虚拟数字人已经来到了我们身边。构成虚拟数字人的三个词语准确地道出了它的特征:“虚拟”指不在物理世界中;“数字”指由图形学、人工智能、动作捕捉、语音合成人工智能等技术手段创造应用;“人”指具有近人特征,如外貌、人类表演/交互能力等。人们期待虚拟数字人,需要拥有人的外观,相貌等人物特征,也要拥有人的行为、语言、表情和动作表达,甚至还拥有人的思维,能识别外界环境、逻辑判断交流互动。

实际上,人们对于虚拟数字人的期待,也正是虚拟数字人的发展历程。虚拟数字人的发展与制作技术的进步密不可分,从最早的手工绘制到现在的 CG、人工智能合成,虚拟数字人大致经历了四个阶段。

上世纪 80 年代,虚拟数字人步入萌芽阶段。那时虚拟数字人的制作技术以手工绘制为主。1982年,日本动画 《超时空要塞》播出后,女主角被制作方包装成为歌手,其发布的专辑成功打入当时日本知名的音乐排行榜 Oricon,世界首位虚拟歌姬诞生。1984 年,英国人 George Stone 打造世界首位虚拟电影演员Max Headroom, MAX参演一部电影,拍摄了数支广告,是在英国家喻户晓的虚拟演员。

21 世纪初,CG 技术、动作捕捉技术突破发展,迎来重大革新,虚拟数字人步入探索阶段。这一阶段的虚拟数字人开始达到实用水平。2001年,《指环王》中的角色咕噜就是由 CG 技术和动作捕捉技术生成。动捕技术被《加勒比海盗》、《猩球崛起》等电影采用。2007 年,二次元虚拟偶像“初音未来”诞生,多次举办演唱会,并活跃至今。2012年,中国内地虚拟女歌手“洛天依”诞生,推出后同样大火。

近五年,自然语言处理、语音识别、计算机视觉等人工智能技术发展,智能驱动的数字人开始崭露头角。2016年,vmodel“Lilmiquela”诞生,累计ins数百万粉丝。2018年,新华社与搜狗联合发布的AI合成主播“新小浩”, 用户输入文本后,屏幕展现数字虚拟人形象并进行新闻播报,且唇形动作与播报声音同步。2019 年,浦发银行数字员工“小浦”, 利用自然语言处理、语音识别、计算机视觉等人工智能技术制作的虚拟数字人。

当前,虚拟数字人正朝着智能化、便捷化、精细化、全面化发展,进入成长阶段。2021,超写实数字人柳夜熙首个视频发布,仿真虚拟人在短视频上首次尝试,首个视频发布不到30小时,粉丝数涨至130万。2022年,由数字王国制作的虚拟邓丽君在江苏卫视跨年演唱会登台献唱,与周深同台演绎《漫步人生路》、《小城故事》和《大鱼》。

根据图形特征,虚拟数字人可分为2D和3D两大类,根据外形不同,可分为卡通、写实等风格,综合来看分为二次元、三维卡通、3D超写实、真人形象孪生四种类型。

由于类型多样,不同虚拟数字人的制作涉及不同技术领域。目前,虚拟数字人制作方式尚未完全定型,人们在通用系统框架的基础上提炼出五横两纵的技术架构。

“五横”是指用于虚拟数字人制作及交互的五大技术模块,即人物生成、人物表达、合成显示、识别感知、分析决策。其中,人物表达包括语音生成和动画生成。动画生成则包含驱动(动作生成)和渲染两大部分。“两纵”是指 2D、3D数字人,3D数字人需要额外使用三维建模技术生成形象,信息维度增加,所需的计算量更大。

广东人工智能与先进计算研究院致力于以三维虚拟内容制作为中心,从智能感知算法、智能传感器件和典型应用形态多层面建立具备高质量、高效率、智能、便携等特质的虚拟产业解决方案。

目前,研究院已具备从设计建模到驱动渲染智能交互全流程技术服务能力,提供的虚拟角色类型包括超写实角色、二次元角色、动漫卡通角色、真人形象角色等,内容形式包括照片海报、短视频、实时直播等。

研究院提供的解决方案包括:数字人原画设计—3D模型—控制绑定—动画渲染—内容生成。

l 原画设计

根据需求设计人物形象。

l 3D模型

根据原画定稿,建立模型和模型雕刻。

l 控制绑定

对人物的骨骼进行绑定,用于后期制作动画。

l 动画渲染

对虚拟数字人开始进行动作表情驱动,动画制作调整,渲染。

l 内容生成

策划内容,生成以虚拟数字人为主角的海报、短视频、MV等内容。

欢迎关注本栏目!我们会持续更新关于虚拟数字人的更多内容!

部分资料来源于《2020年虚拟数字人发展白皮书》等内容,部分图片为转载稿。转载内容及图片不以谋取盈利为使用目的,如涉及版权等问题,请联系广东人工智能与先进计算研究院进行删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档