预期之美: 人工智能与人类体验间的默契

2020 年 4 月 25 日 谷歌开发者

如果您有关注我们在 2019 年 GDC 上分享的内容的话,您也许会感慨人工智能在如今的游戏体验中所占据的比重与地位。我们也曾在《2018 年 Google 设计亮点回顾》一文中专门用一个章节提到了机器学习与用户体验融合的设计成果,还提到了 People + AI Research (PAIR) 专栏。PAIR 专栏会聚焦于深度文章、资源以及框架,从而确保我们在打造人工智能产品时始终不会偏离 "人" 这个核心。


本篇文章的作者 Kristie J. Fisher 博士是 Google 的 UX 研究员,曾参与过的项目包括硬件与 G Suite,以及 ML 生产力工具 (如 meet bot)。她目前在加州威尼斯海滩参与 Ads Planning 团队的工作。


作者 / Kristie Fisher 插画 / Shannon May


机器学习是帮助计算机发现数据中的模式与关系的科学。目前,产品使用机器学习 (ML) 的两种最常见方式是预测性建议和个性化。如果您在 YouTube 上播放过平台推荐的视频,那么您已经是 ML 功能的体验者了。如果您是一个 UXer (用户体验设计师,或在用户体验上投入大量精力的工作者),也许您已经将 ML 纳入到了自己的设计体系之中。


从原则上来说,如果执行到位的话,ML 推荐的内容和个性化功能可以做到想用户之所想,同时避免强迫他们通过导航来翻阅一个个界面或手动进行搜索,从而节省时间和精力。但是,如果执行方面出了问题的话,用户反而需要花费更多时间和精力,即使他们收到的是最准确的建议和最相关的推荐内容。


要理解为什么会发生这种情况,以及如何在自己的设计中避免这种陷阱,首先我们要了解一种被称为 "习惯性 (habituation)" 的现象。



习惯性是人类的天性


重复的行为变得根深蒂固,以至于不动脑子就能执行,这就是我们所说的习惯。您的习惯会告诉您,厨房里的盘子平常被收在哪个柜子里,上车之后不用看也知道油门踏板的位置。您在阅读时无需刻意识别字母、音节、单词和短语,而是可以一气呵成地整段阅读,这都是习惯的力量。  


习惯是一种名为长期增强作用 (Long-term potentiation, LTP) 的神经适应过程的产物。当大脑中相同的神经元路径被反复激活时,就会触发神经元的物理性和化学性变化,从而使信号能够更高效地沿该通路传输。


更高效的神经元路径

= 更有效的认知处理

= 更少的注意力和思考需求


当我们在不经过思考的情况下顺利抵达某地,并完成任务时,我们的感觉就会很良好。这是因为我们已经进化出了尽可能多地利用习惯来 "自动化" 完成任务的能力,这样我们才能在意外情况出现的时候保有充足的认知资源。


数千年前,"意外情况" 是指如何赶走入侵部落的野生动物;如今的 "意外情况" 则可能是如何处理工作中遇到的棘手预算问题,或者因为前方道路施工而不得不选择另一条路线回家。


* 如果您有兴趣深入挖掘这个话题的话,会发现人们已经开发出了一整个研究领域,专门致力于研究这种现象,称为行为经济学,它主要由心理学家 Daniel Kahneman 开创。


习惯性还可以帮助我们进入心流状态 (Flow state, 也会被翻译成 "神驰" 或 "化境"。心理学家 Mihaly Csikszentmihalyi 在 1988 年首次描述了这一现象),在这种状态下,我们完全沉浸在当前的事情中,甚至无法感觉到时间的流逝,同时完全不用去想我们具体是如何去做这些事情的。我们的最佳工作成果往往就诞生于心流之中。



界面习惯 + ML


作为 UXer,习惯性是我们渴望在设计中实现的东西,也是优秀的设计师们似乎仅凭直觉就能掌握的东西。优秀的 UI 通过提供简洁一致的导航方式来促进习惯化,这样用户就可以非常快速地学会不假思索地执行 UI 操作。


例如,最初由 iPhone 采用的简洁的 "长按→滑动→点击" 交互模式彻底变了用户在智能手机上使用 UI 的方式,它去除了复杂、冗余和分层的菜单选项,从而为用户在手机上形成习惯提供了便利。同样,游戏玩家可以毫不费力地在多代 PlayStation 和 Xbox 游戏机 UI 中进行找到自己想要的内容,这要归功于这些设备持续不断地使用同一套按钮机制: OK / Confirm 按钮用于前进,Cancel / Back 按钮用于返回。此外,这些按钮的位置几乎在每一代主机的手柄上都是一致的,这也让游戏玩家可以轻松地在任一系统上持续地游玩游戏。

△ PlayStation 和 Xbox 手柄上键位的一致性使玩家在同一系列主机上的导航变得非常直觉化

现在让我们看看 ML 会如何干扰到用户习惯。首先我们看看完全不使用 ML 的情况。想象一个移动界面,其中包含一组 20 个项目,标记为 A-T,并排列在垂直滚动的网格中。如果用户需要项目 J,那么他们在第一次使用界面时需要查看所有项目,往下滚动,然后查看更多项目,直到他们最终找到 J 并点击。这里查看、滚动、查看、点击这四个步骤缺一不可。


保持这个 UI 不变,重复几次这种操作。只需要在几次重复之后,用户就会知道项目 J 的位置,因此 "查看" 的工作就会被省略。这会将操作精简为两个步骤: 滚动、点击。一旦用户适应了这个交互,就可以用更快的速度完成滚动和点击的过程,并且无需思考,从而进一步减少了时间和精力的消耗。这就是习惯的力量!

△ 在传统界面中用户必须首先仔细查看 UI,但在重复使用后最终可以在不假思索的情况下导航到每个项目,这都要归功于习惯的力量。

现在让我们加入 ML 。想象一下,您希望使用机器学习为用户定制 UI,并简化导航过程。在这个新界面中,算法会首先预测用户在给定时刻可能想要的项目,并相应地重新排列界面,将最佳预测置于顶部。


在这个 "智能化" 的界面中,当 ML 做出正确预测时,即使滚动步骤消失,查看界面内容的步骤也不会消失。这是因为每次交互的 UI 对用户来说都基本上是新的。即使算法随着时间的推移变得更加智能,使得用户期望的项目经常出现在顶部,用户仍然必须查看 UI,以便确认那个自己期望的项目确实在那里——而不是不加思考地点下去。

△ 如果通过机器学习算法重新排序列表中的项目——即使最有用的项目最终位于界面顶部——用户仍然必须每次都对界面进行阅读。

评估新信息和执行视觉检索本身就是一种无法自动化的认知层面的操作。为了适应习惯和自动化,就必须使大脑中完全相同的通路一次次地被激活。如果 UI 每次被用户看到时都会变个样子 ,那么这个自动化 / 习惯化的过程就会被打断。


我主张牺牲一定的 ML 功能,先满足用户的习惯性,这时我就会听到一些反对的声音: "你说的没错,但是如果机器学习算法运作完美的话,效果是惊人的,它可以直接把你想要的东西放到你的手指下面!" 然而不幸的是,机器学习算法永远不会达到完美的准确性,因为它们本质上只是预测工具而已 (这个话题请期待我们后续的文章)。因此,我们不应当把完美预测做为用户体验评价的基准。即使算法高度准确,用户仍然必须阅读 UI 以便对 ML 预测的结果进行评估。如果您的导航流程里有 "评估" 这样的步骤,那么您就会中断用户对 UI 逐渐习惯的过程,一旦习惯的魔力被消除,机器学习将永远不会为用户带来真正 "惊人" 的体验。



用好 ML,但同时拥抱习惯化


很多人会觉得,全新的 ML 技术会让我们重新思考关于 UX 设计的一切,但事实并非如此。ML 的出现并没有改变这样一个事实: 最有用,最令人愉快的 UI 是那些体现出了良好设计原则 (比如习惯性) 的 UI,许多设计师和研究人员 (Don Norman、Jakob Nielsen、Steve Krug 和 Jeff Johnson 等等) 多年来一直在撰文强调这一点。在您跨入机器学习的大门,并将 ML 功能引入 UI 时,我建议考虑以下四个原则: 


1. 将 "决策" 作为导航步骤加以考量

如果您的 ML 设计旨在精简用户的导航步骤,但却要求他们停下手中的工作并评估所有 ML 生成的建议,那么您实际上并没有为用户节省任何步骤或者时间。"对建议进行评估" 或 "在界面上检索内容" 等操作都需要当作导航步骤来考虑,这种操作虽然没有和 UI 进行物理接触,但其权重却和点击操作相同。

2. 在事关重大时,"可预测性" 是 UI 必须品
如果用户在您的产品中执行重要的、时间敏感的任务,例如在给客户提案之前快速更新电子表格,那么就不要在您的 UI 中加入任何可能会损害习惯性的东西。 任何基于 ML 的建议都无法媲美用户的心流状态和肌肉记忆。 但是如果您确信用户有更开放的目标,比如浏览和探索,那么就可以把基于 ML 的动态功能放在 UI 的最前端。

我们来看一个例子。Google Play Music 在满足习惯性需求的用户界面和算法生成的推荐之间取得了良好的平衡。音乐应用的 UI 可以按照字母顺序为用户提供包含数十万首音乐的列表 (虽然很夸张,但这样做仍然不会妨碍用户养成习惯),但由于用户的目标通常是不断浏览曲库,直到找到自己想听的东西,因此 Google Play Music 将 UI 的绝大部分用于根据用户的收听习惯和一天中的时间等因素来推荐音乐。此外它还设置了一个永不改变的导航侧边栏,因此用户仍然习惯于在那里执行基本操作,例如查找已保存的播放列表等等。

△ Google Play Music 界面中智能推荐的内容并不会破坏固定的导航模式
3. 哪里会富于变化,用户需要心中有数

如果您的 ML 算法要提供建议,或是尝试对用户界面进行个性化处理,请考虑在 UI 中专门辟出一块特定的区域来提供智能化建议,而不是基于推荐的内容构建整个 UI。


例如,Google Drive 提供了一个名为 "快速访问" 的功能,该功能使用机器学习来显示您在特定时刻可能需要的一些文档。设计团队不是根据 ML 的预测来重新排序所有文件内容,而是在屏幕顶部为快速访问划分了一个有限的专属空间。UI 的其余部分保持不变,如果您希望在没有 ML 帮助的情况下搜索或导航,还可以直接关闭该功能。

△ Google Drive 的快速访问功能只占据 UI 中一块专属的小区域

4. 将失败作为基准
ML 算法可能会做出错误的预测。想象一下,用户在没有 ML 辅助的情况下完成操作的过程,以及用户纠正 ML带来的错误的过程。如果用户纠正 ML 错误上花费的精力比自己手动完成任务还要多的话,那么这时机器学习实际上并不能创造更好的体验。

例如,Gmail 的智能回复 (Smart Reply) 使用机器学习技术帮助您对电子邮件进行简要的回复。如果您更喜欢自己动手撰写回复,那么 UI 的交互逻辑会使得用户可以轻松忽略掉回复建议,使其不对撰文产生干扰。想象一下这种设计方案: 回复内容被强制插入到回复正文里,如果您不愿意采用它,就必须手动删除或修改。这样的 ML 辅助回复功能给用户带来的工作量要比完全手动撰写回复还要大,而且您不可能习惯用这种方式来回复信件。

△ 想忽略 Gmail Smart Reply 给出的建议很简单,不要点击蓝色的回复建议,而是直接点击最下面的回复按钮即可



保持简洁明了的体验


如果您设计的体验可以让事情变得更轻松,那么用户一定会喜爱它。机器学习有能力相当准确地预测用户在某个时刻需要什么,从而取悦用户,比如快速回复同事的电子邮件,或是看似偶然地发现一首让人爱不释手的新歌。但它也可以增加生活中的随机性,让人更多地分心,并破坏用户的习惯性 (可以说,习惯本身就是一种令人愉快的体验)。作为设计师,我们的工作是了解这些体验中的差异,了解应该如何利用人类大脑的 "魔力",何时才需要动用机器来替代人类完成比较复杂的工作,从而确保我们的用户能够举重若轻地获得自己真正想要的东西。

有关如何采用以人为本的方法进行 ML 和 AI 设计的更多信息,请继续关注 PAIR 专栏。如果您在设计体验中使用人工智能有任何想法、疑问或者经验,欢迎在评论区和我们分享。




推荐阅读



  点击屏末  |  开启设计之旅


登录查看更多
0

相关内容

AI创新者:破解项目绩效的密码
专知会员服务
33+阅读 · 2020年6月21日
《强化学习》简介小册,24页pdf
专知会员服务
272+阅读 · 2020年4月19日
机器学习速查手册,135页pdf
专知会员服务
340+阅读 · 2020年3月15日
万万没想到,枯燥的“机器学习”还可以这样学!
半路转型做人工智能,谁说不可行?
AI前线
3+阅读 · 2018年2月28日
这10个开源人工智能项目,你必须了解!
大数据技术
9+阅读 · 2018年1月2日
如何教育人工智能这个全球74亿人共同的小孩?
微软研究院AI头条
3+阅读 · 2017年11月17日
5年开发老鸟转型人工智能心酸史
算法与数据结构
4+阅读 · 2017年11月13日
AI都干过什么让人细思极恐的事?
全球创新论坛
4+阅读 · 2017年9月15日
Arxiv
14+阅读 · 2020年1月27日
Arxiv
7+阅读 · 2018年1月31日
Arxiv
10+阅读 · 2017年11月22日
Arxiv
9+阅读 · 2016年10月27日
VIP会员
相关VIP内容
相关资讯
万万没想到,枯燥的“机器学习”还可以这样学!
半路转型做人工智能,谁说不可行?
AI前线
3+阅读 · 2018年2月28日
这10个开源人工智能项目,你必须了解!
大数据技术
9+阅读 · 2018年1月2日
如何教育人工智能这个全球74亿人共同的小孩?
微软研究院AI头条
3+阅读 · 2017年11月17日
5年开发老鸟转型人工智能心酸史
算法与数据结构
4+阅读 · 2017年11月13日
AI都干过什么让人细思极恐的事?
全球创新论坛
4+阅读 · 2017年9月15日
相关论文
Arxiv
14+阅读 · 2020年1月27日
Arxiv
7+阅读 · 2018年1月31日
Arxiv
10+阅读 · 2017年11月22日
Arxiv
9+阅读 · 2016年10月27日
Top
微信扫码咨询专知VIP会员