Companies support their customers using live chats and chatbots to gain their loyalty. AFAS is a Dutch company aiming to leverage the opportunity large language models (LLMs) offer to answer customer queries with minimal to no input from its customer support team. Adding to its complexity, it is unclear what makes a response correct, and that too in Dutch. Further, with minimal data available for training, the challenge is to identify whether an answer generated by a large language model is correct and do it on the fly. This study is the first to define the correctness of a response based on how the support team at AFAS makes decisions. It leverages literature on natural language generation and automated answer grading systems to automate the decision-making of the customer support team. We investigated questions requiring a binary response (e.g., Would it be possible to adjust tax rates manually?) or instructions (e.g., How would I adjust tax rate manually?) to test how close our automated approach reaches support rating. Our approach can identify wrong messages in 55\% of the cases. This work demonstrates the potential for automatically assessing when our chatbot may provide incorrect or misleading answers. Specifically, we contribute (1) a definition and metrics for assessing correctness, and (2) suggestions to improve correctness with respect to regional language and question type.


翻译:企业通过在线聊天和聊天机器人服务客户以提升其忠诚度。AFAS是一家荷兰公司,旨在利用大语言模型(LLMs)提供的机遇,以最少甚至无需客服团队介入的方式回答客户查询。问题的复杂性在于,如何定义回答的正确性,尤其是在荷兰语语境中。此外,由于可用于训练的数据有限,挑战在于实时判断大语言模型生成的答案是否正确。本研究首次基于AFAS客服团队的实际决策过程定义了回答正确性标准,并借鉴自然语言生成和自动答案评分系统的相关文献,实现了客服团队决策的自动化。我们通过考察需要二元回答(例如,“能否手动调整税率?”)或操作指引(例如,“如何手动调整税率?”)的问题,测试了自动化方法在多大程度上接近人工客服评分。我们的方法能够在55%的情况下识别错误信息。这项工作展示了自动评估聊天机器人可能提供错误或误导性答案的潜力。具体而言,我们的贡献包括:(1)评估正确性的定义与度量指标;(2)针对区域语言和问题类型提升正确性的改进建议。

0
下载
关闭预览

相关内容

Chatbot,聊天机器人。 chatbot是场交互革命,也是一个多技术融合的平台。上图给出了构建一个chatbot需要具备的组件,简单地说chatbot = NLU(Natural Language Understanding) + NLG(Natural Language Generation)。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员