11月7日,全球第一个全仿真智能虚拟主持人——“AI合成主播”亮相第五届世界互联网大会开幕日。
什么是AI?人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是一门极富挑战性的科学,从事这项工作的人必须懂得计算机知识,心理学和哲学。人工智能是包括十分广泛的科学,它由不同的领域组成,如机器学习,计算机视觉等等,总的说来,人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。“AI合成主播”到底是什么样的?
无论看上去还是听起来,都与现实中的主播的本人播报没有太大差别,连唇形、面部表情也能完全吻合。
搜狗公司智能语音事业部总经理王砚峰表示,在虚拟主播的开发过程中,进行了各种探索尝试,最终在“搜狗分身”技术的支持下,通过人脸关键点检测、人脸特征提取、人脸重构、唇语识别、情感迁移等多项前沿技术,并结合语音、图像等多模态信息进行联合建模训练后,“AI合成主播”正式诞生。
关键技术是什么?搜狗分身。
“搜狗分身”技术是搜狗人工智能的核心技术之一,诞生于搜狗“自然交互+知识计算”这一人工智能理念之下。该技术能够利用搜狗的AI能力,从图像表情,声音语言习惯,逻辑思维等层面对AI进行拟人化训练,然后克隆制造人类的AI分身,进而帮助人类提高信息表达和传递的效率。
搜狗表示,未来还将在娱乐、医疗健康、教育、法律等多个领域提供个性化的内容。为提高社会生产和服务效率,降低行业生产成本,提升民众科技生活体验做出贡献。
领取专属 10元无门槛券
私享最新 技术干货