如何构建一个能够与用户进行对话交互,以完成不同任务的对话系统仍然是自然语言处理领域的一大挑战。任务型对话可以被视作一个序列决策过程,其中一个关键的任务是对话策略学习,其目的是找到一个策略,能够在人机对话交互过程中选择最优的动作,以完成用户的任务。
近年来,深度强化学习被广泛应用到对话策略学习中,提升了对话策略在交互自然度和任务完成度上所能达到的预期回报。然而,在有效建模人机交互和奖励分配上仍存在很多挑战和提升空间。
本期 PW Live,我们邀请到来自清华大学交互式人工智能组的硕士生高信龙一,为大家带来对话策略学习与人机对话交互的主题分享。
对本期主题感兴趣的小伙伴,4 月 23 日(本周四)晚 8 点,我们准时相约 PaperWeekly B 站直播间。
分享提纲
对话策略学习的任务背景
对话策略研究的最新进展与挑战
基于对抗逆向强化学习的对话策略学习与奖励估计
基于多智能体强化学习的对话策略学习与奖励分解
嘉宾介绍
高信龙一 / 清华大学硕士生
直播地址 & 交流群
本次直播将在 PaperWeekly B 站直播间进行,扫描下方海报二维码或点击阅读原文即可免费观看。线上分享结束后,嘉宾还将在直播交流群内实时 QA,在 PaperWeekly 微信公众号后台回复「PW Live」,即可获取入群通道。
B 站直播间:
合作伙伴
🔍
现在,在「知乎」也能找到我们了
进入知乎首页搜索「PaperWeekly」
点击「关注」订阅我们的专栏吧
关于PaperWeekly
PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。