IEEE TPAMI | 火山语音提出多源迁移高斯回归模型，效果超越多个SOTA方法 - 专知

会员服务 ·

0

IEEE TPAMI | 火山语音提出多源迁移高斯回归模型，效果超越多个SOTA方法

2022 年 7 月 8 日 机器之心

机器之心专栏

机器之心编辑部

火山语音团队提出了一种能够有效建模不同领域之间相关性的迁移核函数（transfer kernel），在一些多源但低资源回归场景下显著提升了迁移效果。

一直以来，高斯过程回归模型（Gaussian process regression model, i.e., GP）作为一类基础的贝叶斯机器学习模型，在工程与统计等领域的回归问题中有着广泛应用；传统的高斯过程回归模型需要大量的有监督数据进行训练才可发挥好的效果，但在具体实践中，收集和标记数据是一项昂贵且费时的工程。相比之下，迁移高斯过程回归模型（Transfer GP）能够高效利用不同领域（domain）的数据来降低标记成本，使多源数据应用更加高效。

基于此，火山语音团队对目前研究领域关注较少的多源数据迁移回归问题做了基础探究，提出一种基于多源迁移核函数的迁移高斯回归过程模型（ TRANSFER KERNEL LEARNING FOR MULTI-SOURCE TRANSFER GAUSSIAN PROCESS REGRESSION），并在理论与实验两个层面验证了模型的有效性：即理论上展示了迁移效果优劣与域相关性的必然关联；实验中验证了模型可以高效提升多源数据的迁移效果。

论文链接：https://ieeexplore.ieee.org/document/9802749

这项研究的主要贡献是提出一种能够有效建模不同领域之间相关性的迁移核函数（transfer kernel），并在一些多源但低资源回归场景下提升迁移效果。更重要的一点，该理论全面地展示了不同领域相关性与迁移效果的关系，对未来设计创新的多源迁移算法具有重要的借鉴意义。该研究成果已被人工智能领域顶级国际期刊 IEEE TPAMI 接收。

方法

本文的核心是设计一种迁移核函数，不仅能够准确拟合不同领域的数据的特征，而且能够通过建模不同领域之间的相关性来控制不同源领域（source domain）与目标领域（target domain）的知识迁移强度。挑战在于设计的迁移核函数在符合上述条件的同时，还须满足核函数的基本要求，即半正定性（Postive Semi-definite）。

对此论文首先讨论了迁移核函数应用于迁移高斯回归过程模型中的两种不同策略，即集成策略（ensemble strategy）与一体化策略（all-in-one strategy）的优缺点，而火山语音团队提出的迁移核函数旨在融合两种策略的优势。

具体来说，团队提出了一种多源核函数

。

为每一领域（domain pair）赋予一个可学习的参数化系数，该系数用于建模该领域对的相关性。为了能够拟合不同领域的数据异构特性，针对不同的领域的数据，

利用差异性的基础核函数进行建模。相应就得到如下形式的多源核函数：

但在没有保证半正定性的情况下，上式并不能称为多源核函数，所以接下来就需要研究上述式子在什么条件下是半正定的，进而提出以下定理，其中定理 1 为我们展示了该如何设计

的各组成部分，从而使其成为一个半正定的多源核函数。

设计完成

，团队进一步提出了如何利用

进行迁移高斯回归模型的学习与推理，同时也推导了利用

的迁移高斯回归模型的泛化误差的上下界（ generalization error bounds）。该 bounds 集中展示了迁移效果与不同领域相关性的息息相关，同时源领域与目标领域之间的相关性比不同源领域之间的相关性，对于迁移效果起到更重要的作用。

实验验证

除了理论推导之外，论文验证了该模型准确学习不同领域相关性的能力，即首先研究两个领域下线性与非线性的情况。可以看出，不论是线性还是非线性函数，模型都能够很好学习到两个领域之间的相关性，同时在处理非线性函数时还能取得更好的迁移效果, 即更小的均方根差。

团队还进一步研究了多源情况，即有多个源领域且不同源领域与目标领域的相关性不同。实验结果表明，随着源领域的增多，学习到的源领域与目标领域的相关性越来越复杂，这是由于不同源领域之间的相关性也会影响到源领域与目标领域相关性的学习。

此外还研究了不同的模型下的迁移效果，即根据有限的目标数据和丰富的源数据对大量无监督目标数据的拟合能力，可以看出模型在迁移效果上要远远优于其他模型。

最后，团队还在两个现实数据集中对模型进行了验证。与 9 个 SOTA 方法相比，模型在不同的迁移回归任务中都取得了更好的迁移效果，即更小的均方根差。

© THE END

转载请联系本公众号获得授权

投稿或寻求报道：content@jiqizhixin.com

登录查看更多

1

相关内容

AAAI 2022：三角分解一致性约束的端到端语音翻译

AAAI 2022：三角分解一致性约束的端到端语音翻译

专知会员服务

9+阅读 · 2022年1月17日

NeurIPS2021 | Cycle Self-Training：领域自适应的循环自训练方法与理论

NeurIPS2021 | Cycle Self-Training：领域自适应的循环自训练方法与理论

专知会员服务

20+阅读 · 2021年11月13日

【KDD2021】图神经网络的自适应迁移学习

专知会员服务

66+阅读 · 2021年7月25日

多模态预训练模型简述

多模态预训练模型简述

专知会员服务

113+阅读 · 2021年4月27日

【CVPR2021】DAML：针对开放领域泛化的领域增广元学习方法

【CVPR2021】DAML：针对开放领域泛化的领域增广元学习方法

专知会员服务

20+阅读 · 2021年4月21日

CVPR2021 百度研究院 | 半监督迁移学习的自适应一致性正则化

专知会员服务

31+阅读 · 2021年3月20日

【CVPR2021】半监督迁移学习的自适应一致性正则化

专知会员服务

33+阅读 · 2021年3月7日

【EMNLP2020】开放领域对话的数据增广的方法：“对话蒸馏”

【EMNLP2020】开放领域对话的数据增广的方法：“对话蒸馏”

专知会员服务

30+阅读 · 2020年9月29日

【IJCAI2020】通过双向对抗训练生成中间域样本提升半监督域自适应效果

【IJCAI2020】通过双向对抗训练生成中间域样本提升半监督域自适应效果

专知会员服务

35+阅读 · 2020年9月17日

谷歌提出“T5” 新NLP模型，突破迁移学习局限，多基准测试达SOTA！

谷歌提出“T5” 新NLP模型，突破迁移学习局限，多基准测试达SOTA！

专知会员服务

41+阅读 · 2020年2月26日

从CVPR 2022看域泛化（Domain Generalization）最新研究进展

从CVPR 2022看域泛化（Domain Generalization）最新研究进展

PaperWeekly

1+阅读 · 2022年6月23日

迁移学习前沿探究探讨：低资源、领域泛化与安全迁移

迁移学习前沿探究探讨：低资源、领域泛化与安全迁移

大数据文摘

2+阅读 · 2022年4月13日

LeCun看了都说好！Meta AI一次搞定语音、视觉和文本三个SOTA

LeCun看了都说好！Meta AI一次搞定语音、视觉和文本三个SOTA

新智元

1+阅读 · 2022年2月15日

IJCAI 2021 | 不确定性感知小样本图像分类模型，实现SOTA性能

IJCAI 2021 | 不确定性感知小样本图像分类模型，实现SOTA性能

微软研究院AI头条

0+阅读 · 2021年8月19日

ACL 2021 | 今年NLP的这些论文，你不能错过！

ACL 2021 | 今年NLP的这些论文，你不能错过！

微软研究院AI头条

0+阅读 · 2021年8月3日

【CVPR2021】半监督迁移学习的自适应一致性正则化

【CVPR2021】半监督迁移学习的自适应一致性正则化

专知

41+阅读 · 2021年3月7日

超越MoCo/SimCLR！华人博士提出PCL：无监督学习技术新前沿

超越MoCo/SimCLR！华人博士提出PCL：无监督学习技术新前沿

CVer

17+阅读 · 2020年5月18日

ACL 2019论文分享：ARNOR增强模型注意力，降低远监督学习中的噪声

ACL 2019论文分享：ARNOR增强模型注意力，降低远监督学习中的噪声

AINLP

53+阅读 · 2019年8月15日

【CVPR2019】弱监督图像分类建模

【CVPR2019】弱监督图像分类建模

深度学习大讲堂

38+阅读 · 2019年7月25日

【迁移学习】简述迁移学习在深度学习中的应用

【迁移学习】简述迁移学习在深度学习中的应用

产业智能官

15+阅读 · 2018年1月9日

标签共享子空间多源迁移学习方法及在雷达辐射源识别中的研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于知识迁移的有限样本模式分类研究

国家自然科学基金

5+阅读 · 2014年12月31日

基于深度学习的隐写分析新方法研究

国家自然科学基金

4+阅读 · 2013年12月31日

复杂数据下半参数双重回归模型的统计推断及其应用

国家自然科学基金

0+阅读 · 2013年12月31日

基于深度神经网络的噪声鲁棒性语音识别方法研究

国家自然科学基金

4+阅读 · 2013年12月31日

三维模型在异构空间中的语义迁移方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于图结构的迁移学习在文本倾向性分析中的应用研究

国家自然科学基金

1+阅读 · 2012年12月31日

文本多粒度关系抽取半监督自适应学习的研究

国家自然科学基金

4+阅读 · 2012年12月31日

部分监督学习问题的支持向量机及其应用

国家自然科学基金

3+阅读 · 2012年12月31日

基于小波变换的随机地下水模拟的非平稳谱方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

Advancing Reacting Flow Simulations with Data-Driven Models

Arxiv

0+阅读 · 2022年9月5日

Predictive inference for travel time on transportation networks

Arxiv

0+阅读 · 2022年9月4日

Nested Hierarchical Transformer: Towards Accurate, Data-Efficient and Interpretable Visual Understanding

Arxiv

12+阅读 · 2021年12月30日

Invariant Information Bottleneck for Domain Generalization

Invariant Information Bottleneck for Domain Generalization

Arxiv

15+阅读 · 2021年12月10日

Domain Generalization using Causal Matching

Arxiv

12+阅读 · 2021年6月29日

A Probabilistic Representation of DNNs: Bridging Mutual Information and Generalization

Arxiv

17+阅读 · 2021年6月18日

Knowledge Distillation and Student-Teacher Learning for Visual Intelligence: A Review and New Outlooks

Arxiv

18+阅读 · 2021年6月17日

Adaptive Methods for Real-World Domain Generalization

Arxiv

13+阅读 · 2021年3月29日

Contrastive Clustering

Arxiv

31+阅读 · 2020年9月21日

Extreme Language Model Compression with Optimal Subwords and Shared Projections

Extreme Language Model Compression with Optimal Subwords and Shared Projections

Arxiv

18+阅读 · 2019年9月25日

VIP会员

相关主题

高斯过程回归

相关VIP内容

AAAI 2022：三角分解一致性约束的端到端语音翻译

AAAI 2022：三角分解一致性约束的端到端语音翻译

专知会员服务

9+阅读 · 2022年1月17日

NeurIPS2021 | Cycle Self-Training：领域自适应的循环自训练方法与理论

NeurIPS2021 | Cycle Self-Training：领域自适应的循环自训练方法与理论

专知会员服务

20+阅读 · 2021年11月13日

【KDD2021】图神经网络的自适应迁移学习

专知会员服务

66+阅读 · 2021年7月25日

多模态预训练模型简述

多模态预训练模型简述

专知会员服务

113+阅读 · 2021年4月27日

【CVPR2021】DAML：针对开放领域泛化的领域增广元学习方法

【CVPR2021】DAML：针对开放领域泛化的领域增广元学习方法

专知会员服务

20+阅读 · 2021年4月21日

CVPR2021 百度研究院 | 半监督迁移学习的自适应一致性正则化

专知会员服务

31+阅读 · 2021年3月20日

【CVPR2021】半监督迁移学习的自适应一致性正则化

专知会员服务

33+阅读 · 2021年3月7日

【EMNLP2020】开放领域对话的数据增广的方法：“对话蒸馏”

【EMNLP2020】开放领域对话的数据增广的方法：“对话蒸馏”

专知会员服务

30+阅读 · 2020年9月29日

【IJCAI2020】通过双向对抗训练生成中间域样本提升半监督域自适应效果

【IJCAI2020】通过双向对抗训练生成中间域样本提升半监督域自适应效果

专知会员服务

35+阅读 · 2020年9月17日

谷歌提出“T5” 新NLP模型，突破迁移学习局限，多基准测试达SOTA！

谷歌提出“T5” 新NLP模型，突破迁移学习局限，多基准测试达SOTA！

专知会员服务

41+阅读 · 2020年2月26日

热门VIP内容

开通专知VIP会员享更多权益服务

《物联网（IoT）中的无人机通信高效控制》135页

《在GNSS信号降级环境中利用共识实现无人机集群稳健协调》

中程单向攻击无人机的战略意义：俄乌战争启示

《面向无人机集群的避障动态传感器覆盖算法》最新38页

相关资讯

从CVPR 2022看域泛化（Domain Generalization）最新研究进展

从CVPR 2022看域泛化（Domain Generalization）最新研究进展

PaperWeekly

1+阅读 · 2022年6月23日

迁移学习前沿探究探讨：低资源、领域泛化与安全迁移

迁移学习前沿探究探讨：低资源、领域泛化与安全迁移

大数据文摘

2+阅读 · 2022年4月13日

LeCun看了都说好！Meta AI一次搞定语音、视觉和文本三个SOTA

LeCun看了都说好！Meta AI一次搞定语音、视觉和文本三个SOTA

新智元

1+阅读 · 2022年2月15日

IJCAI 2021 | 不确定性感知小样本图像分类模型，实现SOTA性能

IJCAI 2021 | 不确定性感知小样本图像分类模型，实现SOTA性能

微软研究院AI头条

0+阅读 · 2021年8月19日

ACL 2021 | 今年NLP的这些论文，你不能错过！

ACL 2021 | 今年NLP的这些论文，你不能错过！

微软研究院AI头条

0+阅读 · 2021年8月3日

【CVPR2021】半监督迁移学习的自适应一致性正则化

【CVPR2021】半监督迁移学习的自适应一致性正则化

专知

41+阅读 · 2021年3月7日

超越MoCo/SimCLR！华人博士提出PCL：无监督学习技术新前沿

超越MoCo/SimCLR！华人博士提出PCL：无监督学习技术新前沿

CVer

17+阅读 · 2020年5月18日

ACL 2019论文分享：ARNOR增强模型注意力，降低远监督学习中的噪声

ACL 2019论文分享：ARNOR增强模型注意力，降低远监督学习中的噪声

AINLP

53+阅读 · 2019年8月15日

【CVPR2019】弱监督图像分类建模

【CVPR2019】弱监督图像分类建模

深度学习大讲堂

38+阅读 · 2019年7月25日

【迁移学习】简述迁移学习在深度学习中的应用

【迁移学习】简述迁移学习在深度学习中的应用

产业智能官

15+阅读 · 2018年1月9日

相关基金

标签共享子空间多源迁移学习方法及在雷达辐射源识别中的研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于知识迁移的有限样本模式分类研究

国家自然科学基金

5+阅读 · 2014年12月31日

基于深度学习的隐写分析新方法研究

国家自然科学基金

4+阅读 · 2013年12月31日

复杂数据下半参数双重回归模型的统计推断及其应用

国家自然科学基金

0+阅读 · 2013年12月31日

基于深度神经网络的噪声鲁棒性语音识别方法研究

国家自然科学基金

4+阅读 · 2013年12月31日

三维模型在异构空间中的语义迁移方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于图结构的迁移学习在文本倾向性分析中的应用研究

国家自然科学基金

1+阅读 · 2012年12月31日

文本多粒度关系抽取半监督自适应学习的研究

国家自然科学基金

4+阅读 · 2012年12月31日

部分监督学习问题的支持向量机及其应用

国家自然科学基金

3+阅读 · 2012年12月31日

基于小波变换的随机地下水模拟的非平稳谱方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

相关论文

Advancing Reacting Flow Simulations with Data-Driven Models

Arxiv

0+阅读 · 2022年9月5日

Predictive inference for travel time on transportation networks

Arxiv

0+阅读 · 2022年9月4日

Nested Hierarchical Transformer: Towards Accurate, Data-Efficient and Interpretable Visual Understanding

Arxiv

12+阅读 · 2021年12月30日

Invariant Information Bottleneck for Domain Generalization

Invariant Information Bottleneck for Domain Generalization

Arxiv

15+阅读 · 2021年12月10日

Domain Generalization using Causal Matching

Arxiv

12+阅读 · 2021年6月29日

A Probabilistic Representation of DNNs: Bridging Mutual Information and Generalization

Arxiv

17+阅读 · 2021年6月18日

Knowledge Distillation and Student-Teacher Learning for Visual Intelligence: A Review and New Outlooks

Arxiv

18+阅读 · 2021年6月17日

Adaptive Methods for Real-World Domain Generalization

Arxiv

13+阅读 · 2021年3月29日

Contrastive Clustering

Arxiv

31+阅读 · 2020年9月21日

Extreme Language Model Compression with Optimal Subwords and Shared Projections

Extreme Language Model Compression with Optimal Subwords and Shared Projections

Arxiv

18+阅读 · 2019年9月25日

大家都在搜

大型语言模型

软件无线电

国防科技创新

再见，TD-SCDMA！

微信扫码咨询专知VIP会员