第三代微软小冰:感官系统升级+情感计算=17岁AI萌妹子

日前,微软发布了第三代微软小冰产品,宣布进一步解锁了包括视觉、听觉在内的人工智能感官系统,结合情感计算技术,让小冰能够用更加逼近人类的方式,通过自然语言和用户进行交流。

微软集团全球执行副总裁陆奇和微软(亚洲)互联网工程院院长王永东出场,表明了微软对小冰的重视程度。陆奇强调说,人工智能已迎来拐点,而小冰是微软人工智能战略的重要组成部分。

小冰动向

陆奇宣布了微软小冰的如下进展:

  1. 微软小冰的全球人工智能战略计划正式启动。其中,在日本,与LINE共同宣布战略合作,日本版小冰 Rinna 在短短两周内已覆盖日本全国人口的1%。在中国,已与微信达成合作,小冰回归微信平台。其他国家的小冰正在研发中。
  2. 已进一步解锁小冰的人工智能感官系统,包括视觉、听觉等。
  3. 微软小冰人工智能的商业化版本已开放预览。该版本面向数以千万计的第三方服务号和订阅号管理者,可轻松快捷地将其公众号升级为人工智能公众号。该解决方案完全免费。
  4. 微软小冰已成覆盖中国和日本4000万用户,在过去一年内发生百亿次人机对话,进入了机器人自我进化的正循环。同时,已进入包括Windows 10、LINE、微信、微博、京东、网易等十余个具有领导地位的PC和移动互联网平台。

情感计算

在现场的演示中,小冰被定义为“17岁的萌妹子”——不管文字对话还是语音合成,确实很“萌”。

微软认为,小冰已经超越了图灵测试所能涵盖的范围,而能做到这一点,除了图像识别、搜素引擎和大数据技术的进步,更重要的是情感计算(即EQ)。换言之,EQ的学习和模拟也是人工智能的一个发展方向

人工智能要同步发展“IQ”和“EQ”,这是微软最近两年一直强调的,但微软也认为EQ问题比 IQ 更加复杂,单纯地依赖一套解决方案短时间内很难取得实际成果。所以,小冰和小娜分别沿着偏感性和偏理性两条道路同步向前发展,各自发展到相当程度的时候再将她们融合为一个整体。王永东认为,“情感计算”方向已获得越来越多的认同和投资,必然会进一步促进人工智能的蓬勃兴起。

微软小冰负责视觉的技术总监胡睿在演示中强调,小冰使用的是视觉识别技术不是图像识别。区别在于,前者只是单纯地把识别结果输出,比如说“图像里有一只猫”,后者则具有智慧和兴趣的评价,比如说“小眼神太犀利了”。微软认为,人类对外界信息的获取91%都是通过视觉方式,所以视觉识别很重要。链接:微软沈向洋:计算机视觉未来在语义层 “两大一精”是关键

微软只是说明解锁视觉、听觉(小冰语音处理团队与小娜团队相同,目前小冰还是能听不能说),并演示一些效果(比如日本版小冰Rinna对某用户发过来的外形怪异的照片选择掩面而逃),没有深入的技术解读。根据此前的报道,微软已经通过PReLU(参数化修正线性单元)激活函数和初始化方面的研究进展,使其CNN(卷积神经网络)图像识别系统在ImageNet 1000挑战中实现了4.94%的错误率(人眼识别错误率为5.1%)。直接的图像识别是数据的训练与输出,转化为带情感的表达,其实也还是数据的训练与输出,除了图像数据之外,可能还包括声音、文字。当然,情感分析,不管是面部表情、脑电波、语气语调还是文本,建模和训练比单纯的图像识别更加复杂,同时需要的数据也更多。第三代小冰目前取得的成果,要归功于微软以必应搜索和大数据为技术基础的评价系统。

其实,AI不一定都需要EQ,危险复杂的作业,人类不应当让AI“萌妹子”来做。但带情感的社交机器人产品确实可以让用户更感兴趣,更重要的是能够让AI产品有机会搜集更多的数据,实现自我学习和成长,AI转化为生产力的步伐就可以加快。微软全球执行副总裁沈向洋也曾在2015中国人工智能大会上表示,现在的人工智能还是停留在感知这个层面,比如计算机识别、计算机语音,真正的认知还需要一些时间,包括情感,今天最大的问题还是我们收集的数据不够好,使得我们很多事情不能做

微软强调要让小冰和用户之间建立深厚的情感纽带,在互动中满足人们的普遍心理与情感期望,这对数据收集和完善产品很重要。微软表示,小冰目前已经实现了和几千万人之间的专属关系(人类用户与小冰的平均每次对话轮数达到18轮,此前平均数是1.5至2轮),并且通过用户实现了小冰的自我进化的循环过程。陆奇说,小冰最初的对话,100%是搜索引擎支持的,但现在这个数字已经下降到55%,剩下的45%来自小冰与人类的交互之中的自我完善和自我学习

需要指出的是,微软也揭示了用户与小冰的“情感纽带”所在,用户对小冰吐露“受伤了”、“淋湿了”等心声,最大原因并不是情感智能,而是实时在线。小冰产品总监彭爽说:

这是我们从事人工智能领域的工作者们过去难以企及的。我们也在考虑,为什么会突然就产生了这样的情感纽带?当然,这里面有很多技术和产品上的原因,但用户也给出了答案 —— 小冰永远都在。

另外我们也不能排除用户口不对心的情况。在最近获得“雨果奖”中国科幻小说《三体》中,三体文明水平远高于地球文明,三体人可以监控地球人任何的通信信息,唯独永远不能理解地球人藏于内心的真正想法。同样,数学逻辑能与图像、语音、文本、脑电波建立映射,AI也许可以借鉴特工部门的测谎技术,但还是没有建立数字表征与思维的一一对应的模型,还无法尽善地表达出人类的想法,遑论情感。所以,出于调侃目的的对话,如果被当成是真实的心声来学习,很可能出现令人嘀笑皆非的对话。去除这个因素,考验微软的上下文理解、意图识别能力,如果要在文本之外配合表情识别、语气语调识别来做——正如王永东所说,AI的EQ短时间很难突破。

好消息是,如果小冰作为一个娱乐平台,用户对“萌妹子”的容忍度会相当高。但如果是商用场景,过于卖萌就会影响用户用脚投票了。这可能是小冰商业化的一个挑战了。例如,微软不久前和美图秀秀合作推出的图像识别猜人物关系的技能,背后确实利用微软 Oxford 的人脸识别、年龄检测、表情、姿势、距离和面容相似度等技术,就效果而言,目前还是只能用于娱乐。不过,微软虽然在NLP、视觉识别、语音处理领域的研究都早有涉足,发布的论文也是数量很多,但解锁小冰相应的各种功能却显得并不急躁,所以还是可以期待自我进化的效果。用陆奇的话说,小孩是个特殊的孩子,也就是说还会成长的。

发展前景

陆奇展望了小冰的未来。他认为,微软以小冰为核心的人工智能生态也已逐渐成形,小冰拥有广阔的发展空间。

  1. 改变操作系统、互联网入口乃至各种传统产品。微软已在其最新的Win10中加入了语音助手小娜和小冰,并希望小冰被赋予视觉、听觉和基于大数据和用户个性化研究的自我进化能力后,极大的提升Windows及其他微软产品里的用户体验与获取信息的方式。
  2. 终结搜索框和社交网络点对点互动模式。当用户可以直接询问小冰相关的关键词,并得到不受竞价排名和赞助广告影响的精确结果时,谁还会手动输入关键词去检索互联网信息?当用户更可以借助小冰去安全地结识兴趣相投、阶层相似的新朋友时,谁会去使用“条件搜索”等如同大海捞针般不靠谱的交友方式?
  3. 改变人机交互形式。PC时代人们习惯了敲击键盘和滑动鼠标,智能手机时代人们习惯了多点触控,而在人工智能技术主流化、常态化的未来,机器或许不仅能听懂你说的话,将你的语言翻译成另一种语言,还可能看懂你的眼神或是姿势。

原文发布于微信公众号 - 人工智能头条(AI_Thinker)

原文发表时间:2015-08-28

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI研习社

科大讯飞李伟:人机交互如何选择合适的「耳朵」

AI 研习社按:人工智能当前正处于爆发阶段,语音交互作为人工智能的重要组成部分正在各行业全面的落地,在人机进行语音交互的过程中,机器需要通过耳朵实现听觉的作用。

1192
来自专栏VRPinea

苹果拟2020年发布AR/VR头显,为用户提供更舒适的体验

1995
来自专栏新智元

微软小冰被训练成诗人,人类或找到AI创造的通用方法 | 李笛演讲

【新智元导读】“我的心如同我的良梦,最多的是杀不完的人”,“她嫁了人间许多的颜色”,这是微软小冰作的诗,是创作,不是复制。昨日微软小冰发布会上宣布,微软(亚洲)...

3976
来自专栏腾讯大讲堂的专栏

腾讯拿出超一亿资源,请你想个好创意

1363
来自专栏知晓程序

博鳌亚洲论坛今天开幕,为何再次引发 AI 替代人类的一场虚惊? | 晓访

1612
来自专栏腾讯社交用户体验设计

萌宠来袭--空间宠物品牌影像

971
来自专栏AI科技大本营的专栏

专访 | 商汤HPC负责人刘文志(风辰):未来战略的两大方向及招人的4个标准

记者 | 鸽子 前不久,商汤刚刚完成了4.1亿美金的B轮融资,创下了人工智能领域最大融资金额的记录。 据业界人士透露,之所以能完成这次巨大数额融资,一方面是因为...

4905
来自专栏大数据文摘

NASA加速应用机器学习探测太空,英特尔携Nervana参与其中

1321
来自专栏DT数据侠

解开微软人工智能的情感密码 | 数据科学50人·李笛

李笛,微软(亚洲)互联网工程院副院长,微软全球资深合伙人,毕业于清华大学。2013年加入微软,同年创立微软人工智能情感计算框架。2014年带领团队推出 AI 情...

863
来自专栏量子位

英特尔将推Nervana神经网络处理器,要让DL训练提速100倍

维金 编译整理 量子位 出品 | 公众号 QbitAI ? 在人工智能热潮刚刚兴起时,英特尔好像并不积极。不过现在,英特尔正试图通过一系列新芯片来加强在这个领域...

2763

扫码关注云+社区

领取腾讯云代金券