成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
视觉对话
关注
3
视觉对话主要任务为:AI代理与人类以自然的会话语言对视觉内容进行有意义的对话。具体而言,给定图像,对话历史和关于图像的问题,代理必须将问题置于图像中,从历史推断上下文,并准确的回答问题。视觉对话具有访问和理解的多轮对话历史,所以需要一个可以组合多个信息源的编码器。
综合
百科
VIP
热门
动态
论文
精华
精品内容
UTC: 用于视觉对话的任务间对比学习的统一Transformer
专知会员服务
13+阅读 · 2022年5月4日
【ACMMM2020】面向目标的视觉对话的应答驱动视觉状态估计器
专知会员服务
17+阅读 · 2020年10月11日
【ACMMM2020-北航】KBGN:用于视觉对话中自适应视觉-文本推理的知识桥图网络
专知会员服务
21+阅读 · 2020年8月12日
【CVPR 2019|workshop】视觉问答和对话,Visual Question Answering and Dialog,斯坦福大学|Christopher Manning,Google DeepMind|Karl Moritz Hermann
专知会员服务
16+阅读 · 2019年6月17日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top