【TPAMI2022】关联关系驱动的多模态分类 - 专知

会员服务 ·

0

【TPAMI2022】关联关系驱动的多模态分类

2022 年 3 月 22 日 专知

多模态数据是信息科学领域的常见数据形态，如何有效融合不同模态信息进行分析决策是该领域的重要科学问题。从学习范式来看，现有传统多模态学习范式往往忽视了特征间的关联关系信息和特征的高阶信息；深度多模态学习范式则面临数据饥渴、融合过程语义解释性不强问题。尽管面向多模态信息处理已取得了一些进步，但仍然面临着不同模态语义统一表示难、融合效果提升难等挑战（图1）。

图 1 现有多模态学习范式面临的挑战

针对多模态机器学习面临的挑战，该研究通过采用将特征间的关联关系信息和高阶信息耦合到原数据空间的技术路线（图2），提出了关联关系驱动的融合方法（AF）。该方法首先使用具有语义的幂次函数来建模原始数据的高阶信息来提升数据的非线性表达能力，得到一个增强的特征空间；然后通过计算任意两个特征间的相关性得到关系融合矩阵，使用该融合矩阵将增强的特征空间映射到一个关联关系空间。与主流方法深度学习采用基于学习策略建模数据的非线性相比，AF提供了使用具有语义的函数建模数据非线性能力的新视角；此外，与深度学习采用学习策略得到融合参数矩阵方式相比，AF采用基于统计方法的关联指标计算特征间关系，该策略不仅具有语义，而且没引入额外的学习参数。AF所采用的建模数据非线性能力的方式有望为缓解现有深度学习模型面临的解释性瓶颈问题提供新视角。

图 2 关联关系驱动的多模态融合理论与方法

总的来说，AF方法不仅将不同模态统一表示到语义一致的关联关系空间，也是一个可嵌入现有任意的多模态模型中的通用融合框架，为多模态融合领域面临的语义鸿沟瓶颈问题提供了一个有效解决方案。实验表明，耦合了关联关系的新表示具有更强区分能力（图3）。

图 3 Iris 数据集在原始空间和 AF 空间中的散点图与可分性

研究团队通过耦合AF到最好模态融合、早期融合、晚期融合、模型融合以及深度模型中，提出五种增强的多模态分类算法，该方法在大量的真实数据上都统计优于增强前的方法（见图4、5）。

图 4 AF嵌入不同融合框架实验结果

图 5 与最先进算法的比较结果

参考链接：

https://news.sxu.edu.cn/jxky/6276291cb01643de87a858fc7807637b.htm

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“AFMC” 就可以获取《【TPAMI2022】关联关系驱动的多模态分类》专知下载链接

请扫码加入专知人工智能群（长按二维码），或者加专知小助手微信（zhuanzhi02），加入专知主题群（请备注主题类型：AI、NLP、CV、 KG、论文等）交流~

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取70000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取70000+AI主题知识资源

登录查看更多

3

相关内容

多模态分类

多模态分类

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

专知会员服务

27+阅读 · 2022年3月22日

【WWW2021】基于知识嵌入的图卷积网络

专知会员服务

69+阅读 · 2021年4月27日

【WWW2021】实体自适应语义依赖图立场检测

专知会员服务

22+阅读 · 2021年4月15日

【IJCAJ 2019】多视角知识图谱嵌入的实体对齐，Multi-view Knowledge Graph Embedding for Entity Alignment

【IJCAJ 2019】多视角知识图谱嵌入的实体对齐，Multi-view Knowledge Graph Embedding for Entity Alignment

专知会员服务

59+阅读 · 2020年6月30日

最新《深度多模态数据分析》综述论文，26页pdf

最新《深度多模态数据分析》综述论文，26页pdf

专知会员服务

302+阅读 · 2020年6月16日

论文浅尝 | IRW：基于知识图谱和关系推理的视觉叙事框架

论文浅尝 | IRW：基于知识图谱和关系推理的视觉叙事框架

开放知识图谱

1+阅读 · 2021年10月11日

【WWW2021】实体自适应语义依赖图立场检测

【WWW2021】实体自适应语义依赖图立场检测

专知

2+阅读 · 2021年4月15日

PointNet系列论文解读

PointNet系列论文解读

人工智能前沿讲习班

17+阅读 · 2019年5月3日

【论文笔记】基于实体、属性和关系的知识表示学习

【论文笔记】基于实体、属性和关系的知识表示学习

专知

71+阅读 · 2018年5月22日

关系推理：基于表示学习和语义要素

关系推理：基于表示学习和语义要素

计算机研究与发展

19+阅读 · 2017年8月22日

面向互联网健康诊断的域间互联关系研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于超像素的判别式目标主动轮廓跟踪

国家自然科学基金

1+阅读 · 2014年12月31日

基于对象多尺度特征深度学习的遥感影像变化检测方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于特征结构关系的目标分类研究

国家自然科学基金

1+阅读 · 2012年12月31日

面向工业视觉测量的图像分割及其分割评价方法研究

国家自然科学基金

1+阅读 · 2011年12月31日

USTC-NELSLIP at SemEval-2022 Task 11: Gazetteer-Adapted Integration Network for Multilingual Complex Named Entity Recognition

Arxiv

0+阅读 · 2022年4月18日

Multi-Label Text Classification using Attention-based Graph Neural Network

Arxiv

46+阅读 · 2020年3月22日

Multi-view Knowledge Graph Embedding for Entity Alignment

Arxiv

36+阅读 · 2019年6月6日

Cross-lingual Knowledge Graph Alignment via Graph Matching Neural Network

Arxiv

15+阅读 · 2019年5月28日

EARL: Joint Entity and Relation Linking for Question Answering over Knowledge Graphs

Arxiv

21+阅读 · 2018年1月16日

VIP会员

相关主题

多模态分类

多模态学习

相关VIP内容

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

专知会员服务

27+阅读 · 2022年3月22日

【WWW2021】基于知识嵌入的图卷积网络

专知会员服务

69+阅读 · 2021年4月27日

【WWW2021】实体自适应语义依赖图立场检测

专知会员服务

22+阅读 · 2021年4月15日

【IJCAJ 2019】多视角知识图谱嵌入的实体对齐，Multi-view Knowledge Graph Embedding for Entity Alignment

【IJCAJ 2019】多视角知识图谱嵌入的实体对齐，Multi-view Knowledge Graph Embedding for Entity Alignment

专知会员服务

59+阅读 · 2020年6月30日

最新《深度多模态数据分析》综述论文，26页pdf

最新《深度多模态数据分析》综述论文，26页pdf

专知会员服务

302+阅读 · 2020年6月16日

热门VIP内容

开通专知VIP会员享更多权益服务

Vibe Coding 实践：探讨心流、技术债及可持续应用规范

从代码基础模型到智能体与应用：代码智能的全面综述与实践指南

【NTU博士论文】推进知识增强推理与安全性：迈向可靠的大型语言模型

【MIT博士论文】高效的视觉合成生成模型

相关资讯

论文浅尝 | IRW：基于知识图谱和关系推理的视觉叙事框架

论文浅尝 | IRW：基于知识图谱和关系推理的视觉叙事框架

开放知识图谱

1+阅读 · 2021年10月11日

【WWW2021】实体自适应语义依赖图立场检测

【WWW2021】实体自适应语义依赖图立场检测

专知

2+阅读 · 2021年4月15日

PointNet系列论文解读

PointNet系列论文解读

人工智能前沿讲习班

17+阅读 · 2019年5月3日

【论文笔记】基于实体、属性和关系的知识表示学习

【论文笔记】基于实体、属性和关系的知识表示学习

专知

71+阅读 · 2018年5月22日

关系推理：基于表示学习和语义要素

关系推理：基于表示学习和语义要素

计算机研究与发展

19+阅读 · 2017年8月22日

相关基金

面向互联网健康诊断的域间互联关系研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于超像素的判别式目标主动轮廓跟踪

国家自然科学基金

1+阅读 · 2014年12月31日

基于对象多尺度特征深度学习的遥感影像变化检测方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于特征结构关系的目标分类研究

国家自然科学基金

1+阅读 · 2012年12月31日

面向工业视觉测量的图像分割及其分割评价方法研究

国家自然科学基金

1+阅读 · 2011年12月31日

相关论文

USTC-NELSLIP at SemEval-2022 Task 11: Gazetteer-Adapted Integration Network for Multilingual Complex Named Entity Recognition

Arxiv

0+阅读 · 2022年4月18日

Multi-Label Text Classification using Attention-based Graph Neural Network

Arxiv

46+阅读 · 2020年3月22日

Multi-view Knowledge Graph Embedding for Entity Alignment

Arxiv

36+阅读 · 2019年6月6日

Cross-lingual Knowledge Graph Alignment via Graph Matching Neural Network

Arxiv

15+阅读 · 2019年5月28日

EARL: Joint Entity and Relation Linking for Question Answering over Knowledge Graphs

Arxiv

21+阅读 · 2018年1月16日

大家都在搜

大型语言模型

蓝牙安全攻防

模型压缩 | 知识蒸馏经典解读

微信扫码咨询专知VIP会员