文章/答案/技术大牛

发布

计算式人机交互：如何让机器更加“懂”你？

文章来源：企鹅号 - EduBrain

3月22日，EduBrain技术沙龙邀请了三位清华大学计算机系的教授和老师分享他们对于“AI如何赋能教育”的独到见解，以下为喻纯老师的分享全文，从原理剖析到案例解读，为我们生动分享了目前人机交互的发展现状和未来趋势。

人机交互领域顶级学术会议 CHI（ACM Conference on Human

Factors in Computing Systems） 2017 技术盘点

回顾2018年以前出现的一些人机交互的研究技术和产品，我们会发现，人机交互研究领域最关心的问题是：新的技术如何改变人们的生活，而非一些大数据和后端的AI算法问题。

今天在这里，我也想给大家分享两个方面的观点：一是用户体验不仅仅是设计的问题，比如苹果手机和安卓手机功能是差不多的，但更好的用户体验能让产品更有议价能力。在工业界，很多人会认为产品的用户体验更集中在设计上，这完全是一个比较主观的、比较依靠经验的改进用户体验的方式。

我们认为如果能将体验的问题变得可量化、可计算，获得量化的模型和基础，那我们就能把优化体验这件事做的更加合理。

第二个想跟大家分享的观点是，智能。

智能是一个很广泛的概念，狭义地理解智能可能是和机器学习、神经网络有关的技术，但智能其实是通过研究事物本质的、可解释的内容，基于这些模型和原理来做优化的问题。

平时我在参加（清华大学）计算机系里的一些和人工智能有关的会议、活动的时候，很多在人工智能领域研究地非常深入的老师们分享的问题，并非是怎么通过大数据和深度学习的方法做些什么，更多谈的是不能够做什么。因为，大数据和机器学习更多的是在解决大概率的问题，但当你把产品交付到用户手中时，但凡有一点交互方式不符合他的习惯，那他就会觉得这个产品的用户体验并不好。

❖

什么是计算式人机交互

我们自己对“计算式人机交互”定义是这样：人因（Human factor）+计算（Computation），简单来说就是研究在各种场景、应用、交互系统中人的特征是什么，然后基于人因做计算。这其中包括三方面的工作：

动作建模

在生活中，很多人机交互方式都是人通过动作完成的，研究动作能更好的改进人机交互方式。早在上世纪1954年的时候，就有一位心理学家就做过相关的研究，他当时提出了Fitts定律（费茨法则，任意一点移动到目标中心位置所需时间与该点到目标的距离和大小有关，距离越大时间越长，目标越大时间越短），简单来说就是研究人做运动控制的能力。

具体来说就是当人有目标地点击某处时，点击速度能做到多快。这样的研究工作对于鼠标、触摸屏的设计都非常有价值，能帮助我们进行更好的产品界面优化工作。

费茨法则图例及公式

界面优化

当我们做一款应用时，需要设计它的界面，即Button的布局问题。设计基础也是基于Fitts定律对用户点击的时间做拟合，来设计页面布局。其中，有些研究还是面向残疾人的，研究残疾人的动作能力，来设计针对他们的更友好的交互页面。

在这里我也给大家分享一下前段时间我们和三星合作开展的一个项目，关于手表的Keyboard设计。其实现在智能可穿戴设备中的智能手表设计都有一个很尴尬的问题，在过小的表盘上无法做输入法（的设计），当时我们选择把可转动的表圈设计为Keyboard，用户可通过转动表圈，在手表上进行文本的输入。测试结果表明，用户在1分钟内，通过表圈键盘能做到输入10个单词这样的输入速度。

转动表圈输入文本的手表图示

意图推理

意图推理包括两方面的问题：什么是自然的人机交互，以及如何解释自然输入数据。

人在和机器进行交互时，一般有两个过程。一是意图，在心理层面上人要理解如何操作计算机；二是动作，通过触摸、手势等方式操作计算机。

这两个过程中前者是比较重要的，涉及到“心理模型”的问题，它的定义是人对外部世界运行方式和运行规律的理解。简单来说，对于从来没有操作过电脑的老年人来说，在电脑上输入汉字就是比较困难的事情。而如何设计产品，理解用户心理，让产品符合用户的心理预期模型，是做人机交互最重要的一步。

第二个方面是如何解释自然输入数据的问题，这里我将以文本输入为大家举例。现在很多公司都在布局输入法这方面的市场，比如谷歌、微软、百度、搜狗以及手机厂商等等，原因就在于用户输入的数据对于用户个人的描述是非常重要的，如果企业能了解用户的日常搜索、聊天内容，对于用户增长工作会非常有帮助。

我们实验室在这方面也做了很多研究工作，接下来我就以“触摸打字”这个例子给大家分享一下输入法背后的原理。

现在手机上普遍的输入法就是让用户Touch界面，每次Touch都会产生一个XY的坐标，当用户输入一个字的时候就会产生一系列的XY序列，系统运行的目标就是（通过这一系列的XY序列）从词典中猜词，将候选词显示到界面上以供用户点击，而“如何让猜词更准确”就是输入法需要解决的问题。这种算法除了能应用在传统的硬件键盘输入法设计中，还可以用在“空中打字”等虚拟键盘设计上。

其他还有诸如头部输入法、盲打等输入法的研究。

我个人觉得下一代的人机交互方式会更加自然，会越来越接近于人（的行为）。除此以外，如何做出好的交互，让企业和用户都有好的体验，必须是一个系统的、可计算的优化过程。

—— End ——

作者：喻纯

清华大学计算机科学与技术系副研究员

研究领域为人机交互、普适计算

分享自EduBrain技术沙龙现场

发表于: 2018-03-282018-03-28 18:25:58
原文链接：http://kuaibao.qq.com/s/20180328G1E8WE00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

计算式人机交互：如何让机器更加“懂”你？

相关快讯

扫码

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐