前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >第三代微软小冰:感官系统升级+情感计算=17岁AI萌妹子

第三代微软小冰:感官系统升级+情感计算=17岁AI萌妹子

作者头像
用户1737318
发布2018-06-05 14:48:19
8080
发布2018-06-05 14:48:19
举报
文章被收录于专栏:人工智能头条人工智能头条

日前,微软发布了第三代微软小冰产品,宣布进一步解锁了包括视觉、听觉在内的人工智能感官系统,结合情感计算技术,让小冰能够用更加逼近人类的方式,通过自然语言和用户进行交流。

微软集团全球执行副总裁陆奇和微软(亚洲)互联网工程院院长王永东出场,表明了微软对小冰的重视程度。陆奇强调说,人工智能已迎来拐点,而小冰是微软人工智能战略的重要组成部分。

小冰动向

陆奇宣布了微软小冰的如下进展:

  1. 微软小冰的全球人工智能战略计划正式启动。其中,在日本,与LINE共同宣布战略合作,日本版小冰 Rinna 在短短两周内已覆盖日本全国人口的1%。在中国,已与微信达成合作,小冰回归微信平台。其他国家的小冰正在研发中。
  2. 已进一步解锁小冰的人工智能感官系统,包括视觉、听觉等。
  3. 微软小冰人工智能的商业化版本已开放预览。该版本面向数以千万计的第三方服务号和订阅号管理者,可轻松快捷地将其公众号升级为人工智能公众号。该解决方案完全免费。
  4. 微软小冰已成覆盖中国和日本4000万用户,在过去一年内发生百亿次人机对话,进入了机器人自我进化的正循环。同时,已进入包括Windows 10、LINE、微信、微博、京东、网易等十余个具有领导地位的PC和移动互联网平台。

情感计算

在现场的演示中,小冰被定义为“17岁的萌妹子”——不管文字对话还是语音合成,确实很“萌”。

微软认为,小冰已经超越了图灵测试所能涵盖的范围,而能做到这一点,除了图像识别、搜素引擎和大数据技术的进步,更重要的是情感计算(即EQ)。换言之,EQ的学习和模拟也是人工智能的一个发展方向

人工智能要同步发展“IQ”和“EQ”,这是微软最近两年一直强调的,但微软也认为EQ问题比 IQ 更加复杂,单纯地依赖一套解决方案短时间内很难取得实际成果。所以,小冰和小娜分别沿着偏感性和偏理性两条道路同步向前发展,各自发展到相当程度的时候再将她们融合为一个整体。王永东认为,“情感计算”方向已获得越来越多的认同和投资,必然会进一步促进人工智能的蓬勃兴起。

微软小冰负责视觉的技术总监胡睿在演示中强调,小冰使用的是视觉识别技术不是图像识别。区别在于,前者只是单纯地把识别结果输出,比如说“图像里有一只猫”,后者则具有智慧和兴趣的评价,比如说“小眼神太犀利了”。微软认为,人类对外界信息的获取91%都是通过视觉方式,所以视觉识别很重要。链接:微软沈向洋:计算机视觉未来在语义层 “两大一精”是关键

微软只是说明解锁视觉、听觉(小冰语音处理团队与小娜团队相同,目前小冰还是能听不能说),并演示一些效果(比如日本版小冰Rinna对某用户发过来的外形怪异的照片选择掩面而逃),没有深入的技术解读。根据此前的报道,微软已经通过PReLU(参数化修正线性单元)激活函数和初始化方面的研究进展,使其CNN(卷积神经网络)图像识别系统在ImageNet 1000挑战中实现了4.94%的错误率(人眼识别错误率为5.1%)。直接的图像识别是数据的训练与输出,转化为带情感的表达,其实也还是数据的训练与输出,除了图像数据之外,可能还包括声音、文字。当然,情感分析,不管是面部表情、脑电波、语气语调还是文本,建模和训练比单纯的图像识别更加复杂,同时需要的数据也更多。第三代小冰目前取得的成果,要归功于微软以必应搜索和大数据为技术基础的评价系统。

其实,AI不一定都需要EQ,危险复杂的作业,人类不应当让AI“萌妹子”来做。但带情感的社交机器人产品确实可以让用户更感兴趣,更重要的是能够让AI产品有机会搜集更多的数据,实现自我学习和成长,AI转化为生产力的步伐就可以加快。微软全球执行副总裁沈向洋也曾在2015中国人工智能大会上表示,现在的人工智能还是停留在感知这个层面,比如计算机识别、计算机语音,真正的认知还需要一些时间,包括情感,今天最大的问题还是我们收集的数据不够好,使得我们很多事情不能做

微软强调要让小冰和用户之间建立深厚的情感纽带,在互动中满足人们的普遍心理与情感期望,这对数据收集和完善产品很重要。微软表示,小冰目前已经实现了和几千万人之间的专属关系(人类用户与小冰的平均每次对话轮数达到18轮,此前平均数是1.5至2轮),并且通过用户实现了小冰的自我进化的循环过程。陆奇说,小冰最初的对话,100%是搜索引擎支持的,但现在这个数字已经下降到55%,剩下的45%来自小冰与人类的交互之中的自我完善和自我学习

需要指出的是,微软也揭示了用户与小冰的“情感纽带”所在,用户对小冰吐露“受伤了”、“淋湿了”等心声,最大原因并不是情感智能,而是实时在线。小冰产品总监彭爽说:

这是我们从事人工智能领域的工作者们过去难以企及的。我们也在考虑,为什么会突然就产生了这样的情感纽带?当然,这里面有很多技术和产品上的原因,但用户也给出了答案 —— 小冰永远都在。

另外我们也不能排除用户口不对心的情况。在最近获得“雨果奖”中国科幻小说《三体》中,三体文明水平远高于地球文明,三体人可以监控地球人任何的通信信息,唯独永远不能理解地球人藏于内心的真正想法。同样,数学逻辑能与图像、语音、文本、脑电波建立映射,AI也许可以借鉴特工部门的测谎技术,但还是没有建立数字表征与思维的一一对应的模型,还无法尽善地表达出人类的想法,遑论情感。所以,出于调侃目的的对话,如果被当成是真实的心声来学习,很可能出现令人嘀笑皆非的对话。去除这个因素,考验微软的上下文理解、意图识别能力,如果要在文本之外配合表情识别、语气语调识别来做——正如王永东所说,AI的EQ短时间很难突破。

好消息是,如果小冰作为一个娱乐平台,用户对“萌妹子”的容忍度会相当高。但如果是商用场景,过于卖萌就会影响用户用脚投票了。这可能是小冰商业化的一个挑战了。例如,微软不久前和美图秀秀合作推出的图像识别猜人物关系的技能,背后确实利用微软 Oxford 的人脸识别、年龄检测、表情、姿势、距离和面容相似度等技术,就效果而言,目前还是只能用于娱乐。不过,微软虽然在NLP、视觉识别、语音处理领域的研究都早有涉足,发布的论文也是数量很多,但解锁小冰相应的各种功能却显得并不急躁,所以还是可以期待自我进化的效果。用陆奇的话说,小孩是个特殊的孩子,也就是说还会成长的。

发展前景

陆奇展望了小冰的未来。他认为,微软以小冰为核心的人工智能生态也已逐渐成形,小冰拥有广阔的发展空间。

  1. 改变操作系统、互联网入口乃至各种传统产品。微软已在其最新的Win10中加入了语音助手小娜和小冰,并希望小冰被赋予视觉、听觉和基于大数据和用户个性化研究的自我进化能力后,极大的提升Windows及其他微软产品里的用户体验与获取信息的方式。
  2. 终结搜索框和社交网络点对点互动模式。当用户可以直接询问小冰相关的关键词,并得到不受竞价排名和赞助广告影响的精确结果时,谁还会手动输入关键词去检索互联网信息?当用户更可以借助小冰去安全地结识兴趣相投、阶层相似的新朋友时,谁会去使用“条件搜索”等如同大海捞针般不靠谱的交友方式?
  3. 改变人机交互形式。PC时代人们习惯了敲击键盘和滑动鼠标,智能手机时代人们习惯了多点触控,而在人工智能技术主流化、常态化的未来,机器或许不仅能听懂你说的话,将你的语言翻译成另一种语言,还可能看懂你的眼神或是姿势。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2015-08-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 人工智能头条 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档