首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

论坛“干货”全览!李璇:AI时代的人因工程

2018年11月22日,中国家用电器研究院在京主办了“2018中国家用电器用户体验高峰论坛”。此次论坛汇集了多位行业专家、顶尖设计师及企业相关负责人共襄盛会,共同研究、传递与分享用户体验创新的先进经验和理念。

“构建用户体验新框架——2018中国家用电器用户体验高峰论坛”现场

今天,让我们把目光聚焦于百度人工智能交互设计院,一同倾听他们独到的见解——《AI时代的人因工程》。

百度人工智能交互设计院资深用户体验研究工程师李璇

(以下为李璇演讲实录部分整理内容)

大家好,首先介绍一下我们的业务背景。百度人工智能交互设计院是在2017年11月成立的,是行业内第一个面向人工智能的交互设计研究机构。我们的研究覆盖家庭环境、车载环境以及公共领域登很多场景下的智能交互体验,结论会输出到百度大脑、DUEROS以及APOLLO,同时还会向业界、学界、甚至技术领域输出我们的研究成果。面对AI技术以及AI思维带来的变化,我们希望可以通过研究引领定义最好的人工智能交互。

那么如何去做呢?今天分享的主题就是我们的答案。希望通过今天的分享能跟大家一起,让对人以及对体验的把握,成为我们应对人工智能挑战、人工智能革命的有力武器。

回到我们今天的主题:AI时代的人因工程。什么是人因工程?这里有一个标准定义,通俗的说,人因工程其实就是我们做设计,要把人知道的以及不知道的自己,用做工程的思路,精准、全面、量化地研究透彻,然后应用到设计中。

早在工业时代,人们使用机器来提高生产效率,人机互动是纯物理的机械互动,所以人们研究是人的生理方面的域限,然后基于这些阈限做出人可以承受范围内效率最大化的设计。而这种基于人体特征的研究应用到设计当中的思路也被沿用至今。比如根据空姐的标准身高、臂长来设计飞机的行李舱。

到了信息时时代,让人使用机器替代一部分的认知劳动,人机互动是虚拟的认知交流,所以人因工程研究人的感知规律,来优化信息传递。比如根据人类可以明显区分的最小音量差,5分贝,来设计手机音量键每次调整音量大小。

在过去,人因工程奠定了将人的特征以及规律进行研究,然后应用到设计的基础。那么到了AI时代人因工程又有了哪些新的延伸呢?

首先,AI时代的人因工程让机器越来越像人,它开始可以通过人类的语言、表情等方式进行交流,甚至被赋予人的外形。人类不再需要适应机器,而是让机器适应人。其次机器越来越懂人,不仅懂我们的语言,更懂我们的文化、动机等等。当机器越来越像人的时候,人机关系也会发生变化。人们过去对机器是冷冰冰的,但现在会将越来越多对人的情感、需求和预期都投射到机器上,机器带给人的体验变得更加复杂。所以在这样的情况下,我们认为AI时代的人因工程不仅关乎人的能力、行为、限制和特点,也关乎人的文化和心理,是真正以人类为中心的系统工程。

我们具体该怎么做呢?对于人来说,语音对话是最自然、也是最高效的交流方式,因此,语音交互是AI时代新型交互的一个开端。但其实,整个行业对于怎么样去设计一个好的语音交互,其实还有很多疑问,因此,定义语音交互的体验标准是我们设计院工作的一个开始。

首先,我们梳理出五个语音交互节点:唤醒、响应、输入、理解和反馈。为了打造更好的体验,每个环节下面其实都有非常多的问题需要被研究和定义。比如好的唤醒词是什么样的,比如用户发出指令之后多久响应是好的,比如怎么引导客户比较自然的进行输入等等。我们系统的梳理了每个环节下的体验要点,并且在这个框架下进行了逐一的实验,以确定最优的机器参数和反馈水平。

在完成了大部分语音交互节点之后,我们开始思考,如何在这个基础上让人机交互更加类人,更加让人感觉到它是一个智能体而不仅仅是机器。心理学有一个经典研究结论:人和人的第一印象中大概55%的信息来自外观。这是一个惊人的数字,也给我们很大的启示:外观很重要!目光所及的那一刻,印象就形成了。所以所以首先我们研究作为一个智能体,它的外观应该怎么样?围绕外观可以研究的问题有很多,而经常被争论的是:智能机器是否应该像人?应该多大程度去拟人化?不同部位是否应该是不同的?就以上这些问题,向大家分享一下我们的结果。

首先,我们将拟人度按面部拟人和身体拟人进行拆解。我们根据不同的拟人度分析得到不同结果,比如脸部造型中两个眼睛是关键部位,对于是否增加嘴巴要谨慎;全身拟人方面手是关键部位等等。

除了对前沿的拟人度的探讨,我们还对外观进行了基于现状考虑的研究项目。比如我们对市面上现有的约60款智能音箱进行了梳理,在此基础上,对家居环境下外观偏好进行研究。跟我们的预期有些不一样的是,虽然是智能产品,但当智能产品融入家居环境时候,人们对它们更多希望这个产品能够很好的融入家庭环境,所以选色上,白、银、灰这种颜色以及跟家具搭配的皮革、木质材质都是首选。

在探讨了智能体的外观之后,让交流更加立体是我们的下一个主题。在当下语音交互体验持续优化的基础上,我们认为让人和机器的交流更加自然是人机交互发展的下一个趋势,这也就是我们提到的自然交互。

所谓自然交互,其实就是参照人的信息输入、输出通道来进行交互的一种方式。人类的信息输入包括视听触味嗅,而输出则通过语音、肢体、文字等等。在信息接受方面,视觉和听觉基本上能够满足90%以上的信息需求,所以机器在自然交互的信息输出方面,最主要的其实是处理视觉和听觉信息的配合关系,而在这个问题上,车载环境是一个非常典型的场景。

在车载环境下,智能车机的使用,能让我们进一步解放双手和双眼,更好的保证安全驾驶。但是实际上,语音并不能满足所有的信息传递,比如当我们想要了解路况信息的时候,看一眼界面远远比我们听播报更有效,所以完全不看界面是不可能的,我们希望的是通过声音和屏幕的配合,尽量少的分散用户的资源。因此我们让用户佩戴眼动仪完成驾驶任务,这样就可以让我们看到用户真实的注视情况。同时,通过注视点的叠加我们可以得到热力图,热力图可以定量帮我们记录视觉资源的占用情况。我们发现语音引导质量非常关键,好的语音指导能够大大降低用户对于界面的注视,这样就能得出最优的试听配合方案。

以上所说的是我们在机器输出方面的例子,而在输入方面,语音加肢体,尤其是手势,是人类最自然以及最有效的信息传递方式,虽然生活中人们经常使用到手势,但是如何将手势转化为机器语言还有很多空缺。为此我们研究了手势和语音配合作为输入方式的最优方案。

对于自然交互我们已经开展了一部分的研究,按照这个框架,我们还可以进一步探讨更加多的感知觉通道,比如嗅觉、触觉等等,让我们的交互更加自然。现在大家可以想像一下,如果机器真的可以拥有人类所有的感知觉通道,那么机器可以做的事情将远远超乎人类。不管是前面说的语音交互还是自然交互,完善的都是机器的感知通道,触碰的是人的感知觉,而我们认为情感交互将是一个飞跃,它将触碰人的内心。

所谓的情感交互,其实就是让机器拥有能够具有类似人一样去感知观察、理解和表达情绪的能力。举个例子,当我觉得很悲伤想要听一首歌的时候,具有情感能力的机器人不仅仅随机为我播放热度很高、点击量很高的歌曲,而是播放一些比较温暖的音乐,甚至说上一两句温暖的话语。所以,当机器进化到情感交互这一步的时候,它将不仅能够听话,还能懂事,这是人机关系的进一步深入。机器要完成情感交互,需要对人的情绪进行准确的识别和应对,这是两个非常重要的环节。

首先看情绪识别。人和人在进行交流时候,我们通常通过表情、文本、语音、行为特征这四个方面表达和接收情绪情感。其中,表情无疑是这中间最被广泛研究和应用的一个通道。达尔文说过,能够从表情中识别出情绪,从而对对方的行为作出预判是动物生存的重要技能。所以表情一直都是机器识别的重要课题。所以在这个方面,我们也围绕基于中国人脸的情绪识别进行了研究。

而在情绪应对方面,我们研究高情商的人应该怎么应对悲伤、愤怒等负面情绪,研究心理咨询师怎么应对痛哭流涕的来访者,研究陌生人和好朋友在表达关心时候的区别,从中提取好的应对策略赋予机器。比如我们发现,当人感到很悲伤痛苦的时候,机器不要轻易的去说“我能理解你的感受”,因为作为一个机器真的很难理解,这会显得是一句空话。好的应对策略应该是柔和的灯光、舒缓的音乐、甚至是能够让人放松的气味,千万不要用语言抢占用户的注意力。而为了验证这些应对策略,我们在实验中通过VR模拟场景、诱发用户的情绪,然后让AI去平复他们。

无论是自然交互还是情感交互,这些都是很前瞻的研究领域。在面对这些前瞻性的问题是,我们在研究过程中也遇到过很多问题。在此也分享一下我们在研究方法上的一些心得。第一,由于研究领域越来越前沿,我们需要在研究中不断创造交互体验和场景,比如通过AR、VR技术构建场景。第二,由于我们关注的体验更加多元及立体,我们需要越来越多引入生理测量,脑电、机电、心电都是比较成熟的体系。第三,人脸、声纹、语气等识别技术帮助我们获得大量隐藏在行为背后的数据,比如用户的情绪、需求、动机等,而大数据的运算帮助我们构建常模。

纵观整个从1.0到2.0的思考以及成果,这个过程中我们的研究面不断扩展,对机器和智能的认识都在不断深化。过去我们为基础语音交互定义标准,未来我们将投入更多的精力去打造能够进行自然交互、情感交互的智能体。而在更加超前的未来,我们还可以探讨如何赋予机器意志,让它更加有目的、有动机地进行主动交互,以及在这种类人交互下的人机关系甚至伦理问题。

未来可以探讨的东西还有很多,路也很长,希望在未来还能和大家一起交流探讨,能够成为人工智能领域的开路者和探路者,谢谢大家!

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181130A0TZR900?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券