成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
0
【直播】清华 ACL 2020 长文:多智能体对话策略学习
2020 年 5 月 6 日
AI科技评论
五一结束,系列直播再次开启!
近年来,许多研究已经应用强化学习来训练对话策略并显示出巨大的希望。一种常见的方法是采用用户模拟器来获得大量的模拟用户体验,以满足强化学习算法在对话策略中的训练。
但,建模一个逼真的用户模拟器是具有挑战性的。
基于规则的模拟器需要复杂领域的专业知识,而数据驱动的模拟器则需要大量数据,甚至不清楚如何评估模拟器。
为了避免事先明确地构建用户模拟器,清华大学黄民烈团队(CoAI课题组)在发表于ACL 2020 上的长文《Multi-Agent Task-Oriented Dialog Policy Learning with Role-Aware Reward Decomposition》中提出了多智能体对话策略学习法,该系统将系统和用户都视为对话代理。
两个主体相互交互,并且同时联合学习。该方法使用行为者批判框架来促进预训练并提高可伸缩性。
作者还提出了混合价值网络,用于角色感知奖励分解,以在面向任务的对话中整合每个代理的角色特定的领域知识。
结果表明,该方法可以成功地同时建立系统策略和用户策略,并且两个代理可以通过会话交互获得较高的任务成功率。
论文链接:
https://arxiv.org/pdf/2004.03809.pdf
AI 科技评论邀请论文一作 高信龙一 来给我们详细讲解其研究过程及细节。
主题:多智能体对话策略学习
主讲人:
高信龙一
清华大学计算机系2019级硕士生,交互式人工智能组(CoAI)成员,师从黄民烈教授。主要研究方向为对话系统、推荐系统与强化学习。已在ACL、EMNLP、WWW等顶级会议上发表数篇论文。
时间:
2020年5月6日(周三)晚20:00整
分享提纲:
1.对话策略学习的任务背景
2.对话策略研究的最新进展与挑战
3.基于多智能体强化学习的对话策略学习与奖励分解
更多直播:
ACL 2020原定于2020年7月5日至10日在美国华盛顿西雅图举行,因新冠肺炎疫情改为线上会议。为促进学术交流,方便国内师生提早了解自然语言处理(NLP)前沿研究,AI 科技评论将推出「ACL 实验室系列论文解读」内容,同时欢迎更多实验室参与分享,敬请期待!
点击"阅读原文",直达“ACL 交流小组”了解更多会议信息。
登录查看更多
点赞并收藏
0
暂时没有读者
1
权益说明
本文档仅做收录索引使用,若发现您的权益受到侵害,请立即联系客服(微信: zhuanzhi02,邮箱:bd@zhuanzhi.ai),我们会尽快为您处理
相关内容
对话策略学习
关注
3
近期必读五篇顶会 ACL 2020【知识图谱表示学习 (KGR) 】相关论文
专知会员服务
84+阅读 · 2020年6月16日
近期必读的五篇顶会 ACL 2020【图神经网络 (GNN) 】相关论文
专知会员服务
104+阅读 · 2020年6月9日
近期必读的六篇SIGIR 2020【图神经网络 +推荐(GNN+RS) 】相关论文
专知会员服务
161+阅读 · 2020年6月2日
ACL2020接受论文列表公布,571篇长文208篇短文
专知会员服务
66+阅读 · 2020年5月19日
近期必读的5篇顶会WWW 2020【知识图谱+图神经网络(KG+GNN)】相关论文
专知会员服务
148+阅读 · 2020年4月21日
【清华大学博士论文】富信息网络表示学习及典型应用问题研究, 杨成
专知会员服务
67+阅读 · 2019年11月7日
知识指导的自然语言处理 [微信模式识别中心 林衍凯] CCKS ATT 16-2019
专知会员服务
46+阅读 · 2019年10月25日
问答与对话-技术与系统之人工智能在人机对话系统中的技术现状与挑战【严睿】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第14期
专知会员服务
32+阅读 · 2019年10月23日
社交机器人的挑战性问题,清华大学计算机系黄民烈副教授,SMP 2019 前沿技术讲习班第十五期(CIPS ATT 15)
专知会员服务
18+阅读 · 2019年10月23日
【IJCAI 2019】人工智能在交通中的应用(Artificial Intelligence in Transportation),滴滴AI实验室研究员王征博士,秦志伟博士
专知会员服务
60+阅读 · 2019年8月10日
干货 | ACL 2019 知识图谱的全方位总结
THU数据派
14+阅读 · 2019年8月17日
论文浅尝 | 基于知识库的自然语言理解 02#
开放知识图谱
8+阅读 · 2019年2月24日
大讲堂 | 深度强化学习在电商推荐中的应用
AI研习社
9+阅读 · 2018年11月8日
深度强化学习在NLP怎么用?看清华黄民烈老师这一份120页《自然语言处理和搜索中的深度强化学习应用》讲义
专知
30+阅读 · 2018年9月1日
【论文笔记】强化学习+对抗,面向任务的神经对话模型新思路
专知
6+阅读 · 2018年6月4日
大会 | 清华对话式人工智能课题组六篇长文被ACL、IJCAI-ECAI录用
AI科技评论
10+阅读 · 2018年4月25日
我中心3篇长文被ACL 2018录用
哈工大SCIR
5+阅读 · 2018年4月24日
多轮对话之对话管理:Dialog Management
PaperWeekly
18+阅读 · 2018年1月15日
清华大学冯珺:基于强化学习的关系抽取和文本分类 | 实录·PhD Talk
PaperWeekly
11+阅读 · 2017年11月23日
让聊天机器人同你聊得更带劲 - 对话策略学习 | 论文访谈间 #21
PaperWeekly
7+阅读 · 2017年9月28日
Hierarchical Human Parsing with Typed Part-Relation Reasoning
Arxiv
6+阅读 · 2020年3月10日
Seeing What a GAN Cannot Generate
Arxiv
8+阅读 · 2019年10月24日
Domain Representation for Knowledge Graph Embedding
Arxiv
14+阅读 · 2019年9月11日
Signed Graph Attention Networks
Arxiv
7+阅读 · 2019年9月5日
Latent Relation Language Models
Arxiv
21+阅读 · 2019年8月21日
Dynamic Graph Representation Learning via Self-Attention Networks
Arxiv
52+阅读 · 2019年6月15日
Notes on Deep Learning for NLP
Arxiv
22+阅读 · 2018年8月30日
CoQA: A Conversational Question Answering Challenge
Arxiv
7+阅读 · 2018年8月21日
Hierarchical Pointer Memory Network for Task Oriented Dialogue
Arxiv
3+阅读 · 2018年5月3日
Multiagent Soft Q-Learning
Arxiv
11+阅读 · 2018年4月25日
VIP会员
自助开通(推荐)
客服开通
详情
相关主题
对话策略学习
多智能体
ACL 2020
ACL
智能体
强化学习
相关VIP内容
近期必读五篇顶会 ACL 2020【知识图谱表示学习 (KGR) 】相关论文
专知会员服务
84+阅读 · 2020年6月16日
近期必读的五篇顶会 ACL 2020【图神经网络 (GNN) 】相关论文
专知会员服务
104+阅读 · 2020年6月9日
近期必读的六篇SIGIR 2020【图神经网络 +推荐(GNN+RS) 】相关论文
专知会员服务
161+阅读 · 2020年6月2日
ACL2020接受论文列表公布,571篇长文208篇短文
专知会员服务
66+阅读 · 2020年5月19日
近期必读的5篇顶会WWW 2020【知识图谱+图神经网络(KG+GNN)】相关论文
专知会员服务
148+阅读 · 2020年4月21日
【清华大学博士论文】富信息网络表示学习及典型应用问题研究, 杨成
专知会员服务
67+阅读 · 2019年11月7日
知识指导的自然语言处理 [微信模式识别中心 林衍凯] CCKS ATT 16-2019
专知会员服务
46+阅读 · 2019年10月25日
问答与对话-技术与系统之人工智能在人机对话系统中的技术现状与挑战【严睿】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第14期
专知会员服务
32+阅读 · 2019年10月23日
社交机器人的挑战性问题,清华大学计算机系黄民烈副教授,SMP 2019 前沿技术讲习班第十五期(CIPS ATT 15)
专知会员服务
18+阅读 · 2019年10月23日
【IJCAI 2019】人工智能在交通中的应用(Artificial Intelligence in Transportation),滴滴AI实验室研究员王征博士,秦志伟博士
专知会员服务
60+阅读 · 2019年8月10日
热门VIP内容
开通专知VIP会员 享更多权益服务
《支持 ML/AI 的下一代智能自主网络系统:性能提升与管理》177页
《飞行训练指导:夜间熟悉》152页
数据:联合作战的新弹药
《混合现实飞行模拟器中的夜视镜仿真:无缝集成真实世界》最新54页
相关资讯
干货 | ACL 2019 知识图谱的全方位总结
THU数据派
14+阅读 · 2019年8月17日
论文浅尝 | 基于知识库的自然语言理解 02#
开放知识图谱
8+阅读 · 2019年2月24日
大讲堂 | 深度强化学习在电商推荐中的应用
AI研习社
9+阅读 · 2018年11月8日
深度强化学习在NLP怎么用?看清华黄民烈老师这一份120页《自然语言处理和搜索中的深度强化学习应用》讲义
专知
30+阅读 · 2018年9月1日
【论文笔记】强化学习+对抗,面向任务的神经对话模型新思路
专知
6+阅读 · 2018年6月4日
大会 | 清华对话式人工智能课题组六篇长文被ACL、IJCAI-ECAI录用
AI科技评论
10+阅读 · 2018年4月25日
我中心3篇长文被ACL 2018录用
哈工大SCIR
5+阅读 · 2018年4月24日
多轮对话之对话管理:Dialog Management
PaperWeekly
18+阅读 · 2018年1月15日
清华大学冯珺:基于强化学习的关系抽取和文本分类 | 实录·PhD Talk
PaperWeekly
11+阅读 · 2017年11月23日
让聊天机器人同你聊得更带劲 - 对话策略学习 | 论文访谈间 #21
PaperWeekly
7+阅读 · 2017年9月28日
相关论文
Hierarchical Human Parsing with Typed Part-Relation Reasoning
Arxiv
6+阅读 · 2020年3月10日
Seeing What a GAN Cannot Generate
Arxiv
8+阅读 · 2019年10月24日
Domain Representation for Knowledge Graph Embedding
Arxiv
14+阅读 · 2019年9月11日
Signed Graph Attention Networks
Arxiv
7+阅读 · 2019年9月5日
Latent Relation Language Models
Arxiv
21+阅读 · 2019年8月21日
Dynamic Graph Representation Learning via Self-Attention Networks
Arxiv
52+阅读 · 2019年6月15日
Notes on Deep Learning for NLP
Arxiv
22+阅读 · 2018年8月30日
CoQA: A Conversational Question Answering Challenge
Arxiv
7+阅读 · 2018年8月21日
Hierarchical Pointer Memory Network for Task Oriented Dialogue
Arxiv
3+阅读 · 2018年5月3日
Multiagent Soft Q-Learning
Arxiv
11+阅读 · 2018年4月25日
大家都在搜
洛克菲勒
palantir
大型语言模型
ETHZ博士论文
全面综述
笛卡尔
MoE
汽车智能化
大模型
出海产品从 0 到 1 该怎么做
Top
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top