CVPR 2023开会了！UIUC等最新《知识驱动的视觉语言编码》教程，附ppt - 专知VIP

会员服务 ·

11

CVPR 2023 · 视觉语言编码 ·

2023 年 6 月 24 日

CVPR 2023开会了！UIUC等最新《知识驱动的视觉语言编码》教程，附ppt

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

来自UIUC 哥伦比亚 Meta给出了《知识驱动的视觉语言编码》教程，值得关注！

近年来，视觉-语言(V+L)预训练模型通过学习视觉和文本之间的对齐在多媒体应用中取得了巨大成功。对实体知识(即物体和物体类型)的理解是各种V+L任务的基本能力，如图像描述和视觉问答。它们还需要理解相关知识(即场景图)的能力，这些知识可以进一步支持组合式视觉问答、场景图解析等。除此之外，具有事件论元结构的事件知识(即事件类型、动作、活动)对于支持视觉常识推理、情景识别、动作识别和人与物体交互等认知级视觉理解至关重要。为了跟踪事件和实体的状态变化，将过程性知识引入视频问答、动作识别、动作分割、动作定位、动作预测和过程规划等领域。语言模型中的知识也可以有利于视觉-语言预训练，而不是显式地获取结构化知识。因此，将知识添加到视觉-语言预训练中提出了两个关键挑战，即在多个层次上获取知识，以及对知识的结构和语义进行编码。

在本教程中，我们将全面回顾现有的多媒体知识发现和编码范式，并重点关注它们对视觉-语言预训练的贡献。我们将知识分为内部自我知识和外部自我知识。从文本和视觉模态中提取内部知识，如结构化实体、关系、事件和事件程序。我们将重点关注知识的结构方面，并解决关于跨多模态知识获取和结构编码的两个关键挑战。外部知识可以从知识库或语言模型中获得，本文将举例说明它们在帮助视觉模态的常识理解方面的用途，重点是时间和认知方面。本教程的目标是向参与者介绍知识驱动的视觉-语言研究的最新趋势和新挑战，以及供参与者获得现成模型的学习资源和工具，推动关于结构化知识对文本和视觉学习的影响的深入讨论。

https://blender.cs.illinois.edu/tutorial/KnowledgeVLP/

成为VIP会员查看完整内容

34

相关内容

CVPR 2023

CVPR 2023大会将于 6 月 18 日至 22 日在温哥华会议中心举行。CVPR是IEEE Conference on Computer Vision and Pattern Recognition的缩写，即IEEE国际计算机视觉与模式识别会议。该会议是由IEEE举办的计算机视觉和模式识别领域的顶级会议，会议的主要内容是计算机视觉与模式识别技术。 CVPR 2023 共收到 9155 份提交，比去年增加了 12%，创下新纪录，今年接收了 2360 篇论文，接收率为 25.78%。作为对比，去年有 8100 多篇有效投稿，大会接收了 2067 篇，接收率为 25%。

英伟达斯坦福CVPR2023等最新《去噪扩散模型：生成学习的大爆炸》教程，附300多页ppt

英伟达斯坦福CVPR2023等最新《去噪扩散模型：生成学习的大爆炸》教程，附300多页ppt

专知会员服务

54+阅读 · 2023年6月27日

CVPR 2023开会了！东京大学等最新《神经搜索实战》教程，附300多页ppt

CVPR 2023开会了！东京大学等最新《神经搜索实战》教程，附300多页ppt

专知会员服务

35+阅读 · 2023年6月21日

ChatGPT大模型work三个要点是什么？谷歌JasonWei最新《大型语言模型的缩放、涌现和推理》报告，附Slides与视频

ChatGPT大模型work三个要点是什么？谷歌JasonWei最新《大型语言模型的缩放、涌现和推理》报告，附Slides与视频

专知会员服务

100+阅读 · 2023年4月14日

开课了！CMU《多模态机器学习》2023课程，附课件

开课了！CMU《多模态机器学习》2023课程，附课件

专知会员服务

74+阅读 · 2023年2月12日

开课了！CMU《多模态机器学习》2022课程，附课件与视频

开课了！CMU《多模态机器学习》2022课程，附课件与视频

专知会员服务

155+阅读 · 2022年2月1日

要上手RL？406页《深度强化学习》2022新书，Leiden大学Aske Plaat教授主讲

要上手RL？406页《深度强化学习》2022新书，Leiden大学Aske Plaat教授主讲

专知会员服务

132+阅读 · 2022年1月11日

【干货书】面向程序员的机器学习与人工智能的教科书，681页DF

【干货书】面向程序员的机器学习与人工智能的教科书，681页DF

专知会员服务

121+阅读 · 2021年7月1日

【2020新书】数据并行C++，掌握使用c++和SYCL编写异构系统的dpc++，565页pdf

【2020新书】数据并行C++，掌握使用c++和SYCL编写异构系统的dpc++，565页pdf

专知会员服务

38+阅读 · 2020年12月8日

【2020Manning新书】微前端实战，Micro Frontends in Action，296页pdf

【2020Manning新书】微前端实战，Micro Frontends in Action，296页pdf

专知会员服务

55+阅读 · 2020年8月28日

【Gilles Louppe Spring 2019硬核课程推荐】深度学习：Deep Learning，附639页ppt

【Gilles Louppe Spring 2019硬核课程推荐】深度学习：Deep Learning，附639页ppt

专知会员服务

156+阅读 · 2019年12月20日

ChatGPT大模型全栈技术讲解！霍普金斯最新《NLP：自监督模型》2023课程全面讲解预训练指令学习和RLHF等技术，附讲义

ChatGPT大模型全栈技术讲解！霍普金斯最新《NLP：自监督模型》2023课程全面讲解预训练指令学习和RLHF等技术，附讲义

专知

2+阅读 · 2023年4月8日

ChatGPT背后的语境学习技术是什么？霍普金斯最新NLP课程《In-context Learning》详解，63页ppt

ChatGPT背后的语境学习技术是什么？霍普金斯最新NLP课程《In-context Learning》详解，63页ppt

专知

2+阅读 · 2023年4月7日

ChatGPT背后的对齐用户指令技术是什么？霍普金斯最新NLP课程《自监督模型对齐用户意图》详解，54页ppt

ChatGPT背后的对齐用户指令技术是什么？霍普金斯最新NLP课程《自监督模型对齐用户意图》详解，54页ppt

专知

4+阅读 · 2023年4月6日

不可错过！CMU《结构化数据机器学习》课程，附Slides

不可错过！CMU《结构化数据机器学习》课程，附Slides

专知

0+阅读 · 2022年11月2日

【2022新书】深度学习R语言实战，第二版，568页pdf

【2022新书】深度学习R语言实战，第二版，568页pdf

专知

4+阅读 · 2022年10月23日

不可错过！普林斯顿陈丹琦最新《大语言模型理解》2022课程！全面讲述BERT、GPT、T5等大模型，附Slides

不可错过！普林斯顿陈丹琦最新《大语言模型理解》2022课程！全面讲述BERT、GPT、T5等大模型，附Slides

专知

7+阅读 · 2022年10月19日

【干货书】机器学习练习册，211页pdf，Exercises in Machine Learning

【干货书】机器学习练习册，211页pdf，Exercises in Machine Learning

专知

4+阅读 · 2022年10月5日

Text-to-SQL最新综述：一篇文章讲透任务方法和未来10个发展方向

Text-to-SQL最新综述：一篇文章讲透任务方法和未来10个发展方向

PaperWeekly

0+阅读 · 2022年9月30日

《神经语音合成》最新报告，微软亚研谭旭和台大李宏毅老师INTERSPEECH最新教程！96页ppt

《神经语音合成》最新报告，微软亚研谭旭和台大李宏毅老师INTERSPEECH最新教程！96页ppt

专知

0+阅读 · 2022年9月19日

【2020Manning新书】微前端实战，Micro Frontends in Action，296页pdf

【2020Manning新书】微前端实战，Micro Frontends in Action，296页pdf

专知

18+阅读 · 2020年8月28日

拓扑非线性分析专题讲习班

国家自然科学基金

15+阅读 · 2016年12月31日

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

33+阅读 · 2015年12月31日

组合测试用例优先排序算法及选择策略研究

国家自然科学基金

8+阅读 · 2015年12月31日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

13+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

强调与对比影响语篇理解的认知过程及其神经机制

国家自然科学基金

4+阅读 · 2015年12月31日

基于虚拟原型的信息物理融合系统高效可信构造研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

基于模型驱动的并发建模语言Apla+设计及其可靠性研究

国家自然科学基金

3+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

479+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

147+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

79+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

174+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

84+阅读 · 2023年3月21日

VIP会员

相关主题

视觉语言编码

相关VIP内容

英伟达斯坦福CVPR2023等最新《去噪扩散模型：生成学习的大爆炸》教程，附300多页ppt

英伟达斯坦福CVPR2023等最新《去噪扩散模型：生成学习的大爆炸》教程，附300多页ppt

专知会员服务

54+阅读 · 2023年6月27日

CVPR 2023开会了！东京大学等最新《神经搜索实战》教程，附300多页ppt

CVPR 2023开会了！东京大学等最新《神经搜索实战》教程，附300多页ppt

专知会员服务

35+阅读 · 2023年6月21日

ChatGPT大模型work三个要点是什么？谷歌JasonWei最新《大型语言模型的缩放、涌现和推理》报告，附Slides与视频

ChatGPT大模型work三个要点是什么？谷歌JasonWei最新《大型语言模型的缩放、涌现和推理》报告，附Slides与视频

专知会员服务

100+阅读 · 2023年4月14日

开课了！CMU《多模态机器学习》2023课程，附课件

开课了！CMU《多模态机器学习》2023课程，附课件

专知会员服务

74+阅读 · 2023年2月12日

开课了！CMU《多模态机器学习》2022课程，附课件与视频

开课了！CMU《多模态机器学习》2022课程，附课件与视频

专知会员服务

155+阅读 · 2022年2月1日

要上手RL？406页《深度强化学习》2022新书，Leiden大学Aske Plaat教授主讲

要上手RL？406页《深度强化学习》2022新书，Leiden大学Aske Plaat教授主讲

专知会员服务

132+阅读 · 2022年1月11日

【干货书】面向程序员的机器学习与人工智能的教科书，681页DF

【干货书】面向程序员的机器学习与人工智能的教科书，681页DF

专知会员服务

121+阅读 · 2021年7月1日

【2020新书】数据并行C++，掌握使用c++和SYCL编写异构系统的dpc++，565页pdf

【2020新书】数据并行C++，掌握使用c++和SYCL编写异构系统的dpc++，565页pdf

专知会员服务

38+阅读 · 2020年12月8日

【2020Manning新书】微前端实战，Micro Frontends in Action，296页pdf

【2020Manning新书】微前端实战，Micro Frontends in Action，296页pdf

专知会员服务

55+阅读 · 2020年8月28日

【Gilles Louppe Spring 2019硬核课程推荐】深度学习：Deep Learning，附639页ppt

【Gilles Louppe Spring 2019硬核课程推荐】深度学习：Deep Learning，附639页ppt

专知会员服务

156+阅读 · 2019年12月20日

热门VIP内容

开通专知VIP会员享更多权益服务

《复杂工程系统模型驱动设计决策支持系统：早期设计阶段挑战》最新138页

《日本陆上自卫队2040年作战方式与未来作战研究》最新23页slides

人工智能作为战争武器

《后勤保障》最新23页

相关资讯

ChatGPT大模型全栈技术讲解！霍普金斯最新《NLP：自监督模型》2023课程全面讲解预训练指令学习和RLHF等技术，附讲义

ChatGPT大模型全栈技术讲解！霍普金斯最新《NLP：自监督模型》2023课程全面讲解预训练指令学习和RLHF等技术，附讲义

专知

2+阅读 · 2023年4月8日

ChatGPT背后的语境学习技术是什么？霍普金斯最新NLP课程《In-context Learning》详解，63页ppt

ChatGPT背后的语境学习技术是什么？霍普金斯最新NLP课程《In-context Learning》详解，63页ppt

专知

2+阅读 · 2023年4月7日

ChatGPT背后的对齐用户指令技术是什么？霍普金斯最新NLP课程《自监督模型对齐用户意图》详解，54页ppt

ChatGPT背后的对齐用户指令技术是什么？霍普金斯最新NLP课程《自监督模型对齐用户意图》详解，54页ppt

专知

4+阅读 · 2023年4月6日

不可错过！CMU《结构化数据机器学习》课程，附Slides

不可错过！CMU《结构化数据机器学习》课程，附Slides

专知

0+阅读 · 2022年11月2日

【2022新书】深度学习R语言实战，第二版，568页pdf

【2022新书】深度学习R语言实战，第二版，568页pdf

专知

4+阅读 · 2022年10月23日

不可错过！普林斯顿陈丹琦最新《大语言模型理解》2022课程！全面讲述BERT、GPT、T5等大模型，附Slides

不可错过！普林斯顿陈丹琦最新《大语言模型理解》2022课程！全面讲述BERT、GPT、T5等大模型，附Slides

专知

7+阅读 · 2022年10月19日

【干货书】机器学习练习册，211页pdf，Exercises in Machine Learning

【干货书】机器学习练习册，211页pdf，Exercises in Machine Learning

专知

4+阅读 · 2022年10月5日

Text-to-SQL最新综述：一篇文章讲透任务方法和未来10个发展方向

Text-to-SQL最新综述：一篇文章讲透任务方法和未来10个发展方向

PaperWeekly

0+阅读 · 2022年9月30日

《神经语音合成》最新报告，微软亚研谭旭和台大李宏毅老师INTERSPEECH最新教程！96页ppt

《神经语音合成》最新报告，微软亚研谭旭和台大李宏毅老师INTERSPEECH最新教程！96页ppt

专知

0+阅读 · 2022年9月19日

【2020Manning新书】微前端实战，Micro Frontends in Action，296页pdf

【2020Manning新书】微前端实战，Micro Frontends in Action，296页pdf

专知

18+阅读 · 2020年8月28日

相关基金

拓扑非线性分析专题讲习班

国家自然科学基金

15+阅读 · 2016年12月31日

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

33+阅读 · 2015年12月31日

组合测试用例优先排序算法及选择策略研究

国家自然科学基金

8+阅读 · 2015年12月31日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

13+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

强调与对比影响语篇理解的认知过程及其神经机制

国家自然科学基金

4+阅读 · 2015年12月31日

基于虚拟原型的信息物理融合系统高效可信构造研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

基于模型驱动的并发建模语言Apla+设计及其可靠性研究

国家自然科学基金

3+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

479+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

147+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

79+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

174+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

84+阅读 · 2023年3月21日

微信扫码咨询专知VIP会员