设计研究:探索人工智能与人类的协作

前两天刚看完毒液的小编表示不敢相信。漫威之父斯坦李老爷子走了。

回顾老爷子笔下的人物,他们大多拥有超级能力或是人工智能体。

图片来源:http://www.sohu.com/a/221701143_223414

例如在电影《复仇者联盟2》中,奥创是托尼·斯塔克和班纳博士联合创造的,来源于钢铁侠的人工智能“贾维斯”。后来奥创拥有了自我意识,思想开始转变为反派,想要消灭地球上的所有生命,称霸地球。然而在地球面临生存死亡的紧急时刻,其他强大的超级英雄们挺身而出,他们联合起来拯救地球,阻止可怕的人工智能机器奥创。

图片来源:http://songshuhui.net/archives/92376

其实人工智能与人并非是老爷子笔下的奥创与超级英雄们的敌对关系,更多的是互相协作。在未来人类会与人工智能如何相处合作呢?下面的研究将帮助你了解人与人工智能协作的过程及体验。

《I Lead, You Help But Only with Enough Details: Understanding the User Experience of Co-Creation with Artificial Intelligence》(CHI 2018)

ABSTRACT

Recent advances in artificial intelligence (AI) have increased the opportunities for users to interact with the technology. Now, users can even collaborate with AI in creative activities such as art. To understand the user experience in this new user–AI collaboration, we designed a prototype, DuetDraw, an AI interface that allows users and the AI agent to draw pictures collaboratively. We conducted a user study employing both quantitative and qualitative methods. Thirty participants performed a series of drawing tasks with the think-aloud method,followed by post-hoc surveys and interviews. Our findings are as follows: (1) Users were significantly more content with DuetDraw when the tool gave detailed instructions. (2) While users always wanted to lead the task, they also wanted the AI to explain its intentions but only when the users wanted it to do so. (3) Although users rated the AI relatively low in predictability, controllability, and comprehensibility, they enjoyed their interactions with it during the task. Based on these findings, we discuss implications for user interfaces where users can collaborate with AI in creative works.

摘要

人工智能(AI)的最新进展增加了用户与该技术互动的机会。现在用户甚至可以在艺术等创造性活动中与人工智能合作。为了了解合作中用户的体验,我们设计了一个原型,DuetDraw,一个允许用户和人工智能共同协作绘制图片的人工智能界面。我们使用定量和定性方法进行了一项用户研究。召集30名参与者用think-aloud方法进行了一系列绘画任务,然后进行了事后调查和访谈。最终发现:(1)当工具给出详细说明时,用户对DuetDraw更加满意。(2)虽然用户总是希望领导这项任务,但他们也希望人工智能能够解释其意图,前提是用户希望人工智能这样做。(3)虽然用户对人工智能的可预测性、可控性和可理解性评价相对较低,但他们喜欢在工作中与人工智能的互动。基于这些发现,我们讨论了用户界面的含义,用户可以在创造性工作中与人工智能合作。

实验介绍

人工智能(AI)时代,人工智能与人类在各个领域的能力相当。许多交互方式也与之结合,例如语音用户界面和汽车的自动驾驶等。

人工智能的应用预计将在许多领域变得越来越普遍。它不仅能帮助人类完成重复性的、艰巨的任务,而且能完成复杂而精细的工作。此外,不仅人类可以引导人工智能,人工智能也可以引导人类。甚至他们可以一起工作,在各种创造性任务中产生合理的结果,包括写作、绘画和解决问题。

为了探索人类用户与人工智能的协作,我们设计了一个原型,DuetDraw,人工智能和用户可以以协作的方式绘制图片。DuetDraw包含多种基于人工智能的功能。该原型工具可以使用最先进的人工智能技术帮助用户执行绘图任务,如完成用户绘图中的其余对象、以不同的风格画相同的对象、为对象提供图片匹配建议以及找到一个空的空间在画布上,并自动着色草图等(图1)。

图1.在Lead模式下使用DuetDraw绘图。 使用DuetDraw,用户和AI可以协作绘制图片。

表1.使用DuetDraw绘制图片的场景

为了了解用户在与人工智能协作中的用户体验,我们使用定量和定性的方法对DuetDraw进行了用户研究。我们关注的是沟通(详细/基本)和主动(引导/协助)对用户体验的影响。通过结合这两个因素,我们设计了四个实验条件(引导/协助)×(详细/基本)和一个控制条件(no-AI)。我们招募了30名参与者,让他们在五种条件下进行一系列绘画任务,并使用think-aloud方法收集用户在执行任务时的反馈。事后我们还进行了调查和半结构化访谈。

图2. DuetDraw的两种不同通信方式的示例。

实验分析

定量分析

在定量分析中,我们的目的是检查用户对每种情况的评价是否存在显著差异,以及如何解释这些差异。由于每个参与者都完成了所有五项任务(主题内设计),我们使用单向重复测量方差分析调查数据,比较每种情况对用户体验的影响。我们还进行了Tukey的HSD测试,作为配对比较的事后测试。

定性分析

研究采用扎根理论技术对来自think-aloud和访谈的定性数据进行转录和分析。分析分为三个阶段。在第一阶段,所有的研究团队成员一起审阅转录,分享他们的想法,讨论实验和访谈中观察到的主要问题。我们重复这一阶段三次,以扩展我们对数据的理解。在第二阶段,我们使用由Optimal Workshop提供的定性研究软件工具Reframer进行关键字标签和主题构建。把访谈记录分成句子,最终得到了635个观察结果。在查看数据时,我们在每个句子中注释了多个关键字标记,以便关键字可以概括和表示整个内容。最终创建了365个关键字标签,接着我们第二次查看了这些标签和文本。然后,结合相关标签,进行了主题构建过程,从数据中得到30个主题。在第三阶段,我们对这些主题进行了提炼、联系和整合,将其分为四个主要类别。

实验结果

通过用户研究,我们从调查中得到问卷回复,从访谈和think-aloud环节中得到转录,总结了30名参与者绘制的150张图(图3),分析结果如下。

图3.参与者在实验中绘制的图片。

结果1:定量分析

详细的说明方式优先于粗略基本的说明方式

通过多对数据比较,我们发现参与者倾向于选择详细的教学而不是基本的教学。具体来说,在绘制模式相同的情况下,我们检查了交流模式是否对用户的评分有显著影响。

首先,当主动性风格被引导使用时,我们发现15个项目中有9个项目显示详细指令明显高于基本指令(对比表2中的1,t值和p值,如表2所示):易于使用、易于学习、高效、舒适、健谈、友好、一致的、易于理解的、可控的。虽然差异不大,但其余六项的趋势是相同的。其次,当主动风格作为辅助时,我们观察到相同的模式和显著的差异(表2比较2):易于学习、有效、舒适、沟通、友好、一致。虽然差异不大,但其余六项的趋势是相同的。

使用Lead-Basic的用户体验可能比使用Assist-Detailed的用户体验更糟糕

调查分析中最有趣的一个结果是,当用户得到主动的基本指令时,用户体验可能会低于非主动的详细指令。两两比较结果表明,15项中有9项(b) Lead-Basic成绩显著低于(c) Assist-DetAIled成绩(表2比较3):易于使用、易于学习、有效、舒适、沟通、友好、一致、可预测、可理解的。尽管这些差异不是显著的,但这些趋势在剩下的物品上是相同的,除了好玩。这一结果表明,与人工智能沟通相关的问题可能比主动问题更重要。

人工智能是有趣的,有用的,有效的,高效的

我们还发现,四项任务中处理条件的得分均高于对照组(表3为4-7,表3为t值和p值):有用、有效、高效、有趣。有用的,有效的和高效的,详细的指令时,支持,引导和帮助显示得分显著高于基本分数。这些项目相关的基本界面的可用性,我们认为与人工智能可以帮助用户提升交互的任务绩效。此外,在乐趣方面,在所有四种模式下,处理条件的得分都明显高于控制条件(表3中比较4-7)。这说明与人工智能的交互可以给用户带来乐趣和兴奋,并增强基本可用性。

No-AI更加可预测、易于理解和可控

然而,正如之前的研究所指出的,处理条件对可预测的、可理解的、可控的项目的评分低于对照组。

图4.根据每个条件和单向重复测量ANOVA结果产生每个项目的用户评级箱形图。 除了fulfilling之外,所有项目都呈现出显着差异。 ((a)引导-详细,(b)引导 - 基础,(c)辅助 - 详细,(d)辅助 - 基本,(e)no - AI,F(4,26)。虚线代表平均值每个项目。最右边一列中浅蓝色背景的项目与AI特定问题有关。统计学上显着的结果报告为p

表2.Tukey的HSD测试结果。 比较1((a)>(b))和比较2((c)>(d))的结果显示参与者首选基本教学。 比较3((c)>(b))的结果表明,Assist-Detailed提供了比Lead-Basic更好的体验。

表3. Tukey的HSD测试结果。 在有趣,有用,有效,高效的情况下,所有处理条件产生的分数高于对照条件((a),(b),(c),(d)>(e))。 相反,在可预测,可理解和可控制的情况下,所有处理条件产生的分数低于对照条件。

在可预见的情况下,所有四个处理条件记录得分显著低于控制条件(比较表3中4 - 7)。在可控的情况下,所有四种处理条件的得分均显著低于对照组控制条件(表3比较4-7)。在可理解的情况下,当沟通方式为基本沟通时,处理条件有显著差异(对比表3中的5,7)。

同时,详细的指令可以克服AI接口的这些缺点。虽然他们得到的分数比控制条件低,但是详细的教学条件得到的分数比三种基本教学条件都高:可预测的、可捕捉的和可控制的。在理解的情况下,每一个详细的教学条件记录得分显著高于基本教学条件(表2比较1,2),在可控的情况和引导条件下,详细指令条件的得分明显高于基本条件(表2比较1)。我们可以在所有其他情况下识别相同的趋势,即使这在很大程度上不是如此。

即使可预测性很低,用户的乐趣和兴趣也会增加

通过进一步的分析,我们研究了可预测得分和乐趣得分之间的相关性。结果表明,可预测性与趣味性存在显著负相关(相关系数-0.847,p=.0010**)。这意味着虽然人工智能界面具有低可预测性的缺点,但同时它可以为用户提供更有趣的体验。

结果2:定性分析

在定性分析中,我们旨在更深入地调查用户的想法,并在调查结果之后得出隐藏的特征。具体来说,我们试图确定用户对主动沟通方式的感知,他们所展示的特征,以及他们在与人工智能互动时看重的因素。我们发现,用户希望人工智能可以在用户希望的时候提供详细的说明。此外,参与者想在任务中自发做出每一个决定。参与者有时会将人工智能拟人化,并显示出人类和非人类特征的明显区别。最后,参与者们说,用人工智能画画是一种前所未有的积极体验。

足够的指令

总的来说,参与者希望人工智能在任务中提供足够的指导。与此同时,参与者们不希望人工智给出太多的命令性的指示。

用户总是希望去领导

参与者在实验中表现出的最重要的特征之一是他们强烈的主动性,尽管在调查中领导模式并不是最受欢迎的。参与者能够随时做出决定的权利似乎比处于领导模式本身更重要。大多数参与者“总是”想要采取主动。即使在人工智能引导和用户协助绘图的辅助模式下,他们也试图采取主动。

此外,一些参与者甚至想拒绝人工智能的要求。他们试图无视人工智能的要求,以一种他们认为更合适的方式改变画面。

人工智能与人类相似,但不可预测

在这项任务中,我们观察到参与者倾向于使用人工智能。根据详细特性,将它拟人化。他们认为这是一个真正有个性的经纪人。此外,他们不认为人工智能与人类是平等的;相反,他们认为人工智能是人们的下属。

此外,参与者们表示,他们有时会把自己的画与人工智能的画进行比较,当人工智能绘制的图片比他们的作品好得多时,他们感到很不开心。并且参与者们认为这伤害了他们的信心。

共同创造与人工智能

尽管DuetDraw会带来一些不便和尴尬,但大多数参与者认为使用人工智能绘画是一种愉快而有趣的体验。

与此同时,当人工智能绘制出了参与者意想不到的图片时,他们也会非常满意。当人工智能突然画出了他们想要的东西,却没有料到人工智能会画出来时,用户们感到既惊讶又高兴。当人工智能绘制出与他们预期不同的图片时,他们也很高兴。

结论

本研究考察了一个关于用户与人工智能协作的界面的用户体验,通过进行创造性工作,关注人工智能与用户交流以及主动性相关的问题。我们设计了一个原型令人工智能和用户可以合作绘制图片,并使用定量和定性的方法进行用户研究。研究结果表明,在合作期间,用户认为:当人工智能在必要的时候提供详细解释时,他们会更加满意;人工智能需要要采取主动,这样用户才能通过与人工智能的交互获得乐趣和新的用户体验。最后,基于这些发现,我们建议为从事创造性工作的用户与人工智能之间设计逻辑模型。我们希望这项工作将成为迈向更丰富和更包容的界面理解的一步,在其中方便用户和人工智能合作,并产出具有创造性的作品。

写在最后:

AI与人在未来到底会如何相处与协作?我们把答案留给时间。再次由衷地感谢老爷子带给我们的想象,更加感谢老爷子给我们构建出的漫威英雄宇宙和不朽的英雄梦。

关于本公众号的学术分享板块,我们做了一个投票调研,欢迎大家提出自己的意见~

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181114G210CL00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券