对话推荐系统综述论文，35页pdf，A Survey on Conversational Recommender Systems

摘要

推荐系统是一种软件应用程序，它可以帮助用户在信息过载的情况下找到感兴趣的主题。当前的研究通常假设一个一次性的交互范式，其中用户偏好是根据过去历史观察到的行为来估计的，并且按照等级排序的推荐列表是用户交互的主要的且是单向的形式。对话推荐系统(CRS)采用了一种不同的方法，支持更丰富的交互。例如，这些交互可以帮助改进偏好激发过程，或者允许用户询问关于推荐的问题并给出反馈。对CRS的兴趣在过去几年里显著增加。这种发展主要是由于自然语言处理领域的重大进展，新的语音控制家庭助手的出现，以及聊天机器人技术的增加使用。在本文中，我们详细介绍了现有的对话推荐方法。我们将这些方法按不同的维度进行分类，例如，根据支持的用户意图或用户在后台使用的知识。此外，我们还讨论了技术方法，回顾了CRS的评估方法，并最终确定了一些在未来值得更多研究的差距。

介绍

推荐系统是人工智能在实践中最明显的成功案例之一。通常，这些系统的主要任务是为用户指出感兴趣的潜在主题，例如电子商务网站。因此，它们不仅可以在信息超载的情况下帮助用户，还可以对服务提供商的业务做出重大贡献。在这些实际应用中，推荐是一个一次性的交互过程。通常，底层系统会随着时间的推移监视其用户的行为，然后在预定义的导航情况下(例如，当用户登录到服务时)提供一组定制的建议。尽管这种方法在各个领域都很常见，也很有用，但是它可能有一些潜在的限制。例如，在许多应用程序场景中，用户首选项无法从其过去的交互中可靠地估计出来。对于高介入的产品(例如，当推荐一款智能手机时)，我们甚至可能完全没有过去的观察结果。此外，在一组建议中包含哪些内容可能与上下文高度相关，而且可能很难自动确定用户的当前情况或需求。最后，另一个假设通常是，当用户登录网站时，他们已经知道自己的偏好。然而，这未必是真的。例如，用户可能只在决策过程中确定他们的首选项，例如，当他们意识到选项的空间时。在某些情况下，他们也可能只在与推荐者的交互过程中了解这块内容和可用的选项。对话推荐系统(CRS)是可以帮助解决这些的挑战中的许多这样的问题。一般来说，这种系统的总体思想是支持与用户进行面向任务的多回合对话。例如，在这样的对话中，系统可以引出用户当前的详细偏好，为主题推荐提供解释，或者处理用户对所提建议的反馈。鉴于这类系统的巨大潜力，对CRS的研究已经有了一定的传统。早在20世纪70年代末，Rich就设想了一个电脑化的图书管理员，通过用自然语言互动地向用户提问有关他们的个性和偏好的问题，向他们提出阅读建议。除了基于自然语言处理(NLP)的接口外，近年来还提出了多种基于表单的用户接口。CRS中较早的基于这些接口的交互方法之一称为critiquing，它在1982年就被提出作为数据库领域的查询重新制定的一种方法。在critiquing方法中，用户很快会在对话中看到一个建议，然后可以对这些建议应用预先定义的评论。基于表单的方法通常很有吸引力，因为用户可以使用的操作是预先定义的、明确的。然而，这样的对话也可能出现非自然的，用户可能在表达他们的偏好的方式上感到约束。另一方面，基于NLP的方法在很长一段时间内受到了现有的限制，例如在处理语音命令的上下文中。然而，近年来，语言技术取得了重大进展。因此，我们现在习惯于向智能手机和数字家庭助手发出语音命令，这些设备的识别精度已经达到了令人印象深刻的水平。与语音助手领域的这些发展相对应，我们注意到聊天机器人技术在最近几年的快速发展。聊天机器人，无论是简单的还是复杂的，通常也能处理自然语言，现在广泛应用于各种应用领域，例如，处理客户服务请求。这些技术的进步导致在过去几年中对CRS的兴趣增加。然而，与以前的许多方法相比，我们注意到今天的技术建议更多地是基于机器学习技术，而不是遵循预先定义的对话路径，用于确定要向用户询问的下一个问题。然而，通常在语音助手和聊天机器人的功能与支持真正的对话推荐场景(如系统是语音控制的)所需的功能之间仍然存在差距。本文从不同的角度对对话推荐系统的文献进行了综述。具体地说,我们将讨论(i)CRS的交互模式(第3节),(ii)CRS基于的知识和数据(第4节), 和(iii)CRS中典型的计算任务(第5节)。然后,我们讨论CRS的评估方法(第6节),最后展望未来的发展方向。

对话系统的特征描述

关于什么是CRS，文献中没有一个公认的定义。在这项工作中，我们使用以下定义。 CRS是一个软件系统，它支持用户通过多回合的对话来实现推荐相关的目标。

CRS的概念架构：在过去的二十年中，人们提出了各种CRS模型的技术途径。这些解决方案的技术体系结构的细节取决于系统的功能，例如，是否支持语音输入。尽管如此，仍然可以确定此类体系结构的许多典型概念组件，如图1所示。

CRS交互模式

最近对CRS的兴趣是由NLP的发展和技术进步(如宽带移动互联网接入和智能手机和家庭助手等新设备)推动的。然而，我们对文献的回顾表明，用户和CRS之间的交互既不局限于自然语言输入和输出，也不局限于特定的设备。

知识和背景数据

根据所选择的技术方法，CRS必须结合各种类型的知识和背景数据才能发挥作用。显然，像任何推荐人一样，必须有关于推荐项目的知识。同样，推荐的生成要么基于明确的知识，例如推荐规则或约束，要么基于在一些背景数据上训练的机器学习模型。然而，对话系统通常依赖于其他类型的知识，例如对话中的可能状态，或者用于训练机器学习模型的数据，如记录和转录的自然语言推荐对话。

计算任务

在讨论了推荐对话中可能的用户意图之后，我们现在将回顾CRS的常见的计算任务和技术方法。我们区分(i)主要任务，即那些与推荐过程更直接相关的，例如，计算推荐或确定下一个要问的问题，以及(ii)额外的支持任务。

介绍对话系统的评价

一般情况下，推荐系统可以通过不同的方法从不同的维度进行评价。首先，当系统在其使用上下文中进行评估时，即，当它被部署时，我们通常最感兴趣的是通过A/B测试来衡量系统是否达到了设计目标的具体关键性能指标(KPI)，例如，增加的销售数字或用户参与度。其次，用户研究(实验室实验)通常调查与系统感知质量相关的问题。常见的质量维度是建议的适宜性、流程的可感知透明性或易用性。最后，计算性实验不需要用户参与评估，而是基于客观指标来评估质量，例如，通过测量建议的多样性或计算运行时间来预测测试集中的辅助评级的准确性。同样的质量维度和研究方法也适用于CRS。然而，在比较面向算法的研究和对话系统的研究时，我们发现评估的主要焦点往往是不同的。由于CRS是高度交互的系统，因此与人机交互有关的问题更常用于这些系统的研究。此外，在测量方法方面，CRS评估不仅关注任务的完成，即，如果建议是合适的或最终被接受的，但也涉及到与谈话本身的效率或质量有关的问题。

总结和未来工作

总的来说，我们的研究表明，CRS领域在过去几年中出现了一定程度的复兴，其中最新的方法依赖于机器学习技术，尤其是深度学习和基于自然语言的交互。考虑到语音控制系统(如智能音箱)最近的兴起，以及聊天机器人系统的日益普及，我们预计在未来几年将看到对CRS的更多研究。虽然在某些方面取得了重大进展，但仍有许多领域需要进行更多的研究。在接下来的文章中，我们将概述一些有待解决的问题以及该领域未来可能的发展方向。第一个问题涉及模式的选择。尽管近年来，“自然语言”越来越流行，但究竟哪种情况下“自然语言”才是最好的选择，目前还不完全清楚。需要进行更多的研究来了解哪种模式适合当前给定的任务和情况，或者是否应该向用户提供替代模式。一个有趣的研究方向还在于解释用户的非言语交际行为。此外，完全基于语音的CRS也有一定的局限性，例如，在一个交互周期中提供完整的推荐集合。在这种情况下，用户可能希望对一组推荐进行总结，因为在大多数情况下，当CRS向用户推荐过多(例如多于两三个)选项时，这可能没有意义。

成为VIP会员查看完整内容