As dialogue systems become increasingly important across various domains, a key challenge in persona-based dialogue is generating engaging and context-specific interactions while ensuring the model acts with a coherent personality. However, existing persona-based dialogue datasets lack explicit relations between persona sentences and responses, which makes it difficult for models to effectively capture persona information. To address these issues, we propose MoCoRP (Modeling Consistent Relations between Persona and Response), a framework that incorporates explicit relations into language models. MoCoRP leverages an NLI expert to explicitly extract the NLI relations between persona sentences and responses, enabling the model to effectively incorporate appropriate persona information from the context into its responses. We applied this framework to pre-trained models like BART and further extended it to modern large language models (LLMs) through alignment tuning. Experimental results on the public datasets ConvAI2 and MPChat demonstrate that MoCoRP outperforms existing baselines, achieving superior persona consistency and engaging, context-aware dialogue generation. Furthermore, our model not only excels in quantitative metrics but also shows significant improvements in qualitative aspects. These results highlight the effectiveness of explicitly modeling persona-response relations in persona-based dialogue. The source codes of MoCoRP are available at https://github.com/DMCB-GIST/MoCoRP.


翻译:随着对话系统在各个领域的重要性日益凸显,基于人物设定的对话面临一个关键挑战:在确保模型以连贯人格行事的同时,生成具有吸引力且符合特定情境的交互。然而,现有基于人物设定的对话数据集缺乏人物描述语句与回应之间的显式关系,导致模型难以有效捕捉人物信息。为解决这些问题,我们提出MoCoRP(人物与回应一致性关系建模框架),该框架将显式关系整合至语言模型中。MoCoRP利用自然语言推理专家显式提取人物语句与回应之间的NLI关系,使模型能够有效将上下文中恰当的人物信息融入其回应。我们将该框架应用于BART等预训练模型,并通过对齐调优进一步扩展至现代大语言模型。在ConvAI2和MPChat公开数据集上的实验结果表明,MoCoRP优于现有基线方法,在人物一致性、对话吸引力及情境感知生成方面均表现优异。此外,我们的模型不仅在量化指标上表现突出,在质性评估方面也展现出显著提升。这些结果凸显了在基于人物设定的对话中显式建模人物-回应关系的有效性。MoCoRP的源代码已发布于https://github.com/DMCB-GIST/MoCoRP。

0
下载
关闭预览

相关内容

【CVPR2024】VidLA: 大规模视频-语言对齐
专知会员服务
20+阅读 · 2024年3月31日
ChatAug: 利用ChatGPT进行文本数据增强
专知会员服务
81+阅读 · 2023年3月4日
LibRec 每周算法:LDA主题模型
LibRec智能推荐
29+阅读 · 2017年12月4日
Spark机器学习:矩阵及推荐算法
LibRec智能推荐
16+阅读 · 2017年8月3日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
A Survey of Large Language Models
Arxiv
495+阅读 · 2023年3月31日
Arxiv
25+阅读 · 2023年3月17日
VIP会员
相关论文
相关基金
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员