前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >AI能力再度升级!科大讯飞再谈「超脑2030计划」,展望「机器人」无限未来

AI能力再度升级!科大讯飞再谈「超脑2030计划」,展望「机器人」无限未来

作者头像
镁客网
发布2023-01-04 19:07:00
7260
发布2023-01-04 19:07:00
举报
文章被收录于专栏:镁客网镁客网

基于AI,科大讯飞正努力将数字化与实体经济融合。

作者 | 来自镁客星球的家衡

进入2022年,AI行业变得更加“冷静且成熟”。一边是传统AI应用的投资愈发谨慎,一边是AI绘画、虚拟人、自动驾驶等新兴应用持续爆火。

对于AI行业的未来,国内各家AI厂商都给出了自己的方案,我们欣喜地看到越来越多厂商在应用侧不断发力,尝试打开AI的市场需求量。

在今日举行的科大讯飞“全球1024开发者节”系列发布会上,科大讯飞再次展现自身强大的AI能力,推出多款AI新产品及新技术。

图 | 科大讯飞董事长 刘庆峰

其中,针对智能机器人与数字虚拟人的“讯飞超脑2030计划”,无疑是这次发布会的最大亮点。

虚拟人的未来,这次更清晰

如今,虚拟人已经彻彻底底的“进入”了我们的生活。我们可以在各行各业看到虚拟人的身影。

对比过去的“虚拟偶像”,如今的虚拟人外形上更加逼真,并且更加智能。这背后,AI等技术的突破和介入,很大程度上降低了虚拟人的制作门槛。

对于科大讯飞来说,虚拟人业务可谓专业对口——不仅有自身AI技术作为支撑,更有多年的“老本行”语音技术加持

在去年1024开发者节上,科大讯飞发布虚拟人交互系统1.0,可以在虚拟世界中快速打造虚拟助手或伙伴。

那么一年过去,科大讯飞虚拟人平台进展如何?

科大讯飞总裁吴晓如介绍,在虚拟人交互平台上,过去的一年已经有468家形象设计厂商,和科大讯飞共同打造了700多项虚拟资产。

目前,科大讯飞虚拟人交互平台已经建设了覆盖虚拟助理、虚拟服务机器人、虚拟电商主播、虚拟导游、虚拟IP等数百个形象和声音,为各类客户提供虚拟人解决方案。

而在技术方面,科大讯飞也围绕虚拟人拓展多项新技术。

例如在科大讯飞AI研究院副院长高建清的演讲里,提到了自动创造的虚拟声音,并且开放了500+虚拟合成声音供开发者使用;由语音语义驱动的虚拟人动作技术,可以真实地驱动虚拟人的动作;基于图表示的深度语义理解以及基于知识学习的可控多轮对话生成。

最后,高建清还带来了一项“重磅彩蛋”——一套高沉浸人机的交互系统,可以在裸眼3D场景下与虚拟人实时交互

以上种种技术,都旨在让虚拟人更加真实、智能。

在活动现场,观众也可以实时体验一次“AI虚拟人”:通过语音合成、方言迁移、三维人脸重建、语音口唇驱动等多项技术,只需拍摄一张自己的照片加录制自己说的一段话,就能制作出专属自己的3D虚拟人形象。

再谈“超脑2030计划”,这次有何不同?

不过尽管虚拟人的概念大红大紫,但从目前的应用来看,依然局限在服务领域与泛娱乐领域。有业内人士表示,在脱离数字属性之后,虚拟人不过是“披着数字外衣”的机器人,依然摆脱不了人的控制。

相比之下,实体机器人在自主性上较虚拟人更加独立,应用场景也更加丰富。

今年年初,科大讯飞董事长刘庆峰宣布启动“讯飞超脑2030计划”,希望让人工智能懂知识、善学习、能进化,让机器人走进每个家庭。

两会上,刘庆峰进一步指出:要加强机器人的研发,支持多模感知、情感计算、主动对话、虚拟形象等关键技术与陪伴机器人产品研发,让机器人走进每个家庭,以解决老年人的养老、情感陪伴、健康管理等问题。

此外,刘庆峰还认为未来陪伴机器人会向汽车一样普及。

在当时,科大讯飞提出了2030计划“三步走”战略,而在今天的发布会上,刘庆峰再次完善了“讯飞超脑2030计划”的远景规划——

阶段一,2022-2023年,目标为从医疗、教学、健康等方面底层的技术出发,完成软硬一体机器人和数字虚拟人的制造,让数字虚拟人在数字经济、虚拟世界真正地帮助人类; 阶段二,2023-2025年,目标为进一步发展到自适应行走的外骨骼机器人,能够让外骨骼机器人真正进入到生活之中。 阶段三,即2025-2030年,目标为打造懂知识会学习的陪伴机器人、自主学习的虚拟人,让人工智能拥有交互能力、动作能力。

从“三步走”战略来看,科大讯飞希望从软硬件两端都完成机器人布局。其中软件端是虚拟人,而硬件端则是陪伴机器人

事实上,科大讯飞在本次1024开发节上还展示了机器狗、仿人型机器人等多种实体形态的机器人。刘庆峰表示,讯飞要让这些机器人进入每一个家庭、每一个企业。

目前,要让机器人更加智能完善,就需要大量底层技术的支撑。对此,科大讯飞将技术突破放在四大方向——感知、表达、认知以及运动控制能力

此外,科大讯飞也提到,实现支撑超脑2030的发展,有两个关键的算法有待突破,分别是无监督学习和知识推理

在具体的应用上,科大讯飞消费者BG总裁于继栋在他的演讲中展示了多项与机器人相关的AI产品,包括提升实体机器人能力的机器人超脑平台AIBOT、基于科大讯飞超脑平台的宇树科技四足机器人,以及与医疗领域的柔性机械臂等等。

通过超脑平台,机器人能够具备多模感知AI能力,未来还可以持续提升自主进化学习能力。另外,讯飞的机器人超脑平台,构建了一个非常开放的生态,为广大机器人开发者提供了非常方便的一站式解决方案。

AI向新,数智万物

在刘庆峰的演讲里,重点提到了数字经济的重要性:“目前,数字经济已经成为全球复苏的关键动力,而AI恰是数字经济发展的核心引擎。”

而从其他几场发布会中,我们又可以窥见科大讯飞在实体经济的尝试,包括机器人、包括各类智能硬件,也包括火爆的智能汽车业务。

两者相结合,恰好概括了本次开发者节的主题——“AI向新·数智万物”。科大讯飞正借助AI这个引擎,将数字化与实体经济相融合。

回到开头所说,当下的AI行业变得“愈发冷静”,AI厂商们已经不是单纯地炫技,开始在应用侧不断发力。

对于科大讯飞而言,超脑2030计划便是他们交出的“答卷”。

在劳动力短缺、老龄化不断严重的社会背景下,机器狗、仿人型机器人、虚拟人等应用可以有效缓解以上提到的问题。

未来,科大讯飞将继续用软硬一体化的技术能力,让虚拟人与机器人走进千家万户。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-11-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 镁客网 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 虚拟人的未来,这次更清晰
  • 再谈“超脑2030计划”,这次有何不同?
  • AI向新,数智万物
相关产品与服务
语音合成
语音合成(Text To Speech,TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多场景、多语言的音色选择,支持 SSML 标记语言,支持自定义音量、语速等参数,让发音更专业、更符合场景需求。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档