【COLING2024】从多模态大型语言模型到人类水平的人工智能：模态、指令、推理、效率及超越 - 专知VIP

会员服务 ·

19

COLING 2024 · 多模态大型语言模型 · 教程 ·

【COLING2024】从多模态大型语言模型到人类水平的人工智能：模态、指令、推理、效率及超越

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

人工智能（AI）涵盖了跨越各种模态的知识获取和现实世界的基础。作为一个多学科研究领域，多模态大型语言模型（MLLMs）最近在学术界和工业界引起了越来越多的关注，显示出通过MLLMs实现人类水平AI的前所未有的趋势。这些大型模型通过集成和建模多种信息模态（包括语言、视觉、听觉和感官数据），为理解、推理和规划提供了有效的工具。本教程旨在全面综述MLLMs领域的前沿研究，重点关注四个关键领域：MLLM架构设计、指令学习、多模态推理和MLLMs的效率。我们将探讨技术进步，总结主要挑战，并讨论未来研究的潜在方向。

成为VIP会员查看完整内容

28

相关内容

COLING 2024

【新书】生成式人工智能的提示工程：为可靠的AI输出提供面向未来的输入

【新书】生成式人工智能的提示工程：为可靠的AI输出提供面向未来的输入

专知会员服务

50+阅读 · 5月25日

【WWW2024教程】大型语言模型驱动智能体，附slides

【WWW2024教程】大型语言模型驱动智能体，附slides

专知会员服务

44+阅读 · 5月14日

【AAAI2024】推进大型语言模型的空间推理:基于StepGame基准的深入评估与增强

【AAAI2024】推进大型语言模型的空间推理:基于StepGame基准的深入评估与增强

专知会员服务

25+阅读 · 1月13日

【NeurIPS2023】EmbodiedGPT：通过具体思维链的视觉-语言预训练

【NeurIPS2023】EmbodiedGPT：通过具体思维链的视觉-语言预训练

专知会员服务

29+阅读 · 2023年9月24日

模仿学习综述：算法、最新进展和挑战

模仿学习综述：算法、最新进展和挑战

专知会员服务

60+阅读 · 2023年9月9日

如何构建CV中的AGI？华为最新《计算机视觉中的人工通用智能：从GPT和大型语言模型中学到的经验教训》

如何构建CV中的AGI？华为最新《计算机视觉中的人工通用智能：从GPT和大型语言模型中学到的经验教训》

专知会员服务

55+阅读 · 2023年6月21日

【OpenAI-John Schulman】从人类反馈中强化学习:进展与挑战

【OpenAI-John Schulman】从人类反馈中强化学习:进展与挑战

专知会员服务

61+阅读 · 2023年4月22日

现在大火的“In-context Learning”是什么？北大等最新《语境学习ICL》综述论文，详述ICL进展、挑战和方向

现在大火的“In-context Learning”是什么？北大等最新《语境学习ICL》综述论文，详述ICL进展、挑战和方向

专知会员服务

34+阅读 · 2023年1月3日

【斯坦福博士论文】不确定性和信息为机器学习提供决策支持

【斯坦福博士论文】不确定性和信息为机器学习提供决策支持

专知会员服务

96+阅读 · 2022年9月9日

【2021干货书】Python可解释人工智能，207页pdf，Explainable AI with Python

【2021干货书】Python可解释人工智能，207页pdf，Explainable AI with Python

专知会员服务

182+阅读 · 2021年5月17日

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

专知

34+阅读 · 2023年4月13日

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

专知

25+阅读 · 2023年4月11日

【2022新书】元学习: 理论，算法和应用, 404页pdf

【2022新书】元学习: 理论，算法和应用, 404页pdf

专知

18+阅读 · 2022年11月27日

综述| 当图神经网络遇上强化学习

综述| 当图神经网络遇上强化学习

图与推荐

25+阅读 · 2022年7月1日

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

专知

15+阅读 · 2021年1月24日

【复旦大学-SP2020】NLP语言模型隐私泄漏风险

【复旦大学-SP2020】NLP语言模型隐私泄漏风险

专知

10+阅读 · 2020年4月20日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

11+阅读 · 2020年2月12日

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

论智

26+阅读 · 2018年10月30日

资深算法工程师万宫玺：Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 分享总结

资深算法工程师万宫玺：Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 分享总结

AI研习社

11+阅读 · 2018年1月4日

Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 回顾

Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 回顾

AI研习社

11+阅读 · 2017年12月16日

语义Web知识库补全关键技术研究

国家自然科学基金

9+阅读 · 2017年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

SDN数据平面中大规模流表的高性能查找方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

31+阅读 · 2015年12月31日

大规模模糊RDF数据管理关键技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

6+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

22+阅读 · 2015年12月31日

项目知识情境提取与展现方法研究：基于主题模型和知识地图的大数据视角

国家自然科学基金

0+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

1+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

10+阅读 · 2012年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

142+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

77+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

149+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

349+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

99+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

59+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

123+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

40+阅读 · 2023年3月22日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

70+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

18+阅读 · 2023年3月17日

VIP会员

相关主题

多模态大型语言模型

相关VIP内容

【新书】生成式人工智能的提示工程：为可靠的AI输出提供面向未来的输入

【新书】生成式人工智能的提示工程：为可靠的AI输出提供面向未来的输入

专知会员服务

50+阅读 · 5月25日

【WWW2024教程】大型语言模型驱动智能体，附slides

【WWW2024教程】大型语言模型驱动智能体，附slides

专知会员服务

44+阅读 · 5月14日

【AAAI2024】推进大型语言模型的空间推理:基于StepGame基准的深入评估与增强

【AAAI2024】推进大型语言模型的空间推理:基于StepGame基准的深入评估与增强

专知会员服务

25+阅读 · 1月13日

【NeurIPS2023】EmbodiedGPT：通过具体思维链的视觉-语言预训练

【NeurIPS2023】EmbodiedGPT：通过具体思维链的视觉-语言预训练

专知会员服务

29+阅读 · 2023年9月24日

模仿学习综述：算法、最新进展和挑战

模仿学习综述：算法、最新进展和挑战

专知会员服务

60+阅读 · 2023年9月9日

如何构建CV中的AGI？华为最新《计算机视觉中的人工通用智能：从GPT和大型语言模型中学到的经验教训》

如何构建CV中的AGI？华为最新《计算机视觉中的人工通用智能：从GPT和大型语言模型中学到的经验教训》

专知会员服务

55+阅读 · 2023年6月21日

【OpenAI-John Schulman】从人类反馈中强化学习:进展与挑战

【OpenAI-John Schulman】从人类反馈中强化学习:进展与挑战

专知会员服务

61+阅读 · 2023年4月22日

现在大火的“In-context Learning”是什么？北大等最新《语境学习ICL》综述论文，详述ICL进展、挑战和方向

现在大火的“In-context Learning”是什么？北大等最新《语境学习ICL》综述论文，详述ICL进展、挑战和方向

专知会员服务

34+阅读 · 2023年1月3日

【斯坦福博士论文】不确定性和信息为机器学习提供决策支持

【斯坦福博士论文】不确定性和信息为机器学习提供决策支持

专知会员服务

96+阅读 · 2022年9月9日

【2021干货书】Python可解释人工智能，207页pdf，Explainable AI with Python

【2021干货书】Python可解释人工智能，207页pdf，Explainable AI with Python

专知会员服务

182+阅读 · 2021年5月17日

热门VIP内容

相关资讯

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

专知

34+阅读 · 2023年4月13日

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

专知

25+阅读 · 2023年4月11日

【2022新书】元学习: 理论，算法和应用, 404页pdf

【2022新书】元学习: 理论，算法和应用, 404页pdf

专知

18+阅读 · 2022年11月27日

综述| 当图神经网络遇上强化学习

综述| 当图神经网络遇上强化学习

图与推荐

25+阅读 · 2022年7月1日

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

专知

15+阅读 · 2021年1月24日

【复旦大学-SP2020】NLP语言模型隐私泄漏风险

【复旦大学-SP2020】NLP语言模型隐私泄漏风险

专知

10+阅读 · 2020年4月20日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

11+阅读 · 2020年2月12日

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

论智

26+阅读 · 2018年10月30日

资深算法工程师万宫玺：Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 分享总结

资深算法工程师万宫玺：Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 分享总结

AI研习社

11+阅读 · 2018年1月4日

Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 回顾

Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 回顾

AI研习社

11+阅读 · 2017年12月16日

相关基金

语义Web知识库补全关键技术研究

国家自然科学基金

9+阅读 · 2017年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

SDN数据平面中大规模流表的高性能查找方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

31+阅读 · 2015年12月31日

大规模模糊RDF数据管理关键技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

6+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

22+阅读 · 2015年12月31日

项目知识情境提取与展现方法研究：基于主题模型和知识地图的大数据视角

国家自然科学基金

0+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

1+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

10+阅读 · 2012年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

142+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

77+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

149+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

349+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

99+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

59+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

123+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

40+阅读 · 2023年3月22日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

70+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

18+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员