阿里AI智能音箱现在有了视觉能力,跟人交互时表情丰富

安妮 发自 751D·Park 量子位 出品 | 公众号 QbitAI

昨天,在阿里巴巴2018年春季发布会上,阿里AI实验室推出了第二代中文人机交流系统AliGenie 2.0,在“听”和“说”的基础上引入了视觉能力,搭载AliGenie 2.0的“精灵火眼”功能也同时亮相。

此外,天猫路由、天猫魔屏S1和天猫精灵曲奇三款新品也一同面市。

阿里AI实验室负责人浅雪在发布会现场

AliGenie 2.0

距离去年7月发布搭载了AliGenie的天猫精灵X1已八个月有余,销量怎么样了?阿里AI实验室负责人浅雪表示已经卖出了200万台。

和以往不太一样的是,此次推出的AliGenie2.0具备了视觉的能力,能够进行视觉认知、多模态交互、情景感知。

AliGenie 2.0首先将视觉能力落地在天猫精灵X1上,通过具有天猫精灵手机APP实现“精灵火眼”功能。

此外,阿里AI实验室还推出了一个可以戴在天猫精灵X1头上的“帽子”XHolder,以便将手机放在XHolder支架上捕捉图像,同时手机还会显示出一对大眼睛。

天猫精灵X1+XHolder+App精灵火眼

对了,XHolder目前售价为49.9元。

XHolder外观

核心功能

精灵火眼的核心能力有两个:“视觉认知”和“表情系统”。

表情系统是指基于3D虚拟形象,提供自然交互的表情拟态动画,目前包括近20多种拟态动画。通过App的屏幕触摸它的鼻子眼睛或额头,能得到不同的反馈,还能看到它生气或撒娇的样子。

视觉认知主要面向儿童,精灵火眼通过图像识别,结合智能语音互动、声音朗读,帮助儿童读书、识字。

目前,阿里AI实验室已经联合中国少年儿童出版社、安徽少儿出版社等国内顶尖的出版社,选择了适合3岁到8岁儿童的117套图书,儿童只需将绘本展示给天猫精灵,即可听到有声版的故事。

庄周梦蝶故事画面

此外,老年人也是精灵火眼的一大受众。阿里AI实验室开发了识别药盒的功能,与阿里健康合作,能够识别4万种药盒。只要用精灵火眼扫一扫药盒,就能用语音播报药名、功效、过期日等信息。

未来,阿里AI实验室还将计划引入万物识别、人脸识别等功能。“我们今天推出的精灵火眼功能,也只是视觉功能的开始。”阿里人工智能实验室产品总监释空在接受采访时说。

这里还有一个插曲。

在现场演示精灵火眼功能时,天猫精灵还一度没有声音,只有两只大眼睛做着各种各样的表情。在程序员“祭天”回来的二度展示时,声音才恢复正常。

新品三连发

除了精灵火眼外,此次发布会还推出了阿里AI实验室的三款新品。

天猫路由售价199元,是一个“没有触角”的路由,天线为隐形设计,不同Wifi热点之间无缝切换。

天猫魔屏S1是一个可以联合天猫精灵联合使用的投影仪,最大投射屏幕300吋,售价4699元,以后在家里就能享受巨幕效果了。

天猫精灵曲奇是个Q版的智能音箱,身高只有天猫精灵X1的一半,目前预售价为299元。

可以发现,这三款新设备,刚好是人机交互的“输入设备”,“链接设备”以及人机交互的“输出设备”。阿里方表示,输入/连接/输出的智能化这是AI实验室对智联网的三个关键组成部分的理解。

“我们生活在一个工业时代跨度到数字时代的过程,我们今天可能没有办法改变一个药盒的外观,但是我们可以改变一个药盒的浏览方式,这就是人工智能实验室想为我们这个世界带来的一点点爱。”浅雪说。

作者系网易新闻·网易号“各有态度”签约作者

原文发布于微信公众号 - 量子位(QbitAI)

原文发表时间:2018-03-23

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏VRPinea

2017年 VRPinea厂商年终回访报告(十三):米多娱乐

2198
来自专栏量子位

要把AI建在赤道上的华为,为何用全栈全场景方案打响第一枪

所谓全场景,从应用视角出发,囊括了公有云、私有云、各种边缘计算、物联网行业终端以及消费类终端等部署环境,即当前AI应用的所有场景。

1175
来自专栏罗超频道

语音巨头时代来临!谁将是中国Siri?

大约一年前,中国移动以13.6亿人民币的代价获得了科大讯飞15%的股权,后者股价一路攀升,从不足30元到最高61元,成为一大牛股,市值高达240多亿人民...

4039
来自专栏新智元

《福布斯》:语音分析潜力惊人,除了NLP、情感和智能

【新智元导读】《福布斯》今日刊文,指出语音分析蕴含惊人商业潜力:除了客服,如今通过语音分析还能理解人意,甚至检测真假信息。 语音分析不仅包括机器对自然语言理解...

40612
来自专栏PPV课数据科学社区

【聚焦】如何利用大数据进行价值兑现才是正经事

如果有一天你可以预测未来,你要做的第一件事情是什么?买彩票?第二件、第三件事情呢? 先卖个关子,我们后面再说这件事情。 大数据是个产业,广义上指的是在这个信息过...

2783
来自专栏AI科技大本营的专栏

语音入口大战升级,Echo音箱还不是杀手锏,等所有汽车都用上Alexa就不一样了

【AI科技大本营导读】大多数人都认为,智能音箱就是语音入口之争的主战场……比如双十一期间,阿里巴巴不惜血本也要99元强推天猫精灵,亏损数亿终于砸出中国智能音箱市...

3629
来自专栏FreeBuf

企业安全建设初期的几点反思

前言 近些年,随着安全行业蒸蒸日上,越来越多的互联网公司认识到安全对公司的重要性,逐步建立自己的安全团队。但工作十年、经验丰富、适合负责整个安全团队的人在业内非...

2095
来自专栏程序员笔记

讲一个故事

1725
来自专栏新智元

谷歌发布智能家居中枢Home,激战亚马逊背后的自我颠覆

【新智元导读】10月4日,谷歌举行新品发布会,发布了两款 Pixel 手机,VR产品 DayDream View 眼镜和三款智能家庭终端设备——Google电视...

3907
来自专栏钱塘大数据

【干货】几张图看懂高级经理人与普通管理者的区别

德鲁克曾经说过,管理者必须卓有成效。管理者是否卓有成效的根本原因不在于学历、不在于年龄、也不在于参加了多少大牌的领导力课程,更重要的是在于管理思考问题的方式。我...

742

扫码关注云+社区

领取腾讯云代金券