【NeurIPS 2020】"鸡尾酒会"基于课程学习策略的自监督发声物体的判别性感知与定位 - 专知VIP

会员服务 ·

0

NeurIPS 2020 · 鸡尾酒会 · 语音识别 ·

2020 年 11 月 3 日

【NeurIPS 2020】"鸡尾酒会"基于课程学习策略的自监督发声物体的判别性感知与定位

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

如何在具有多种声源的『鸡尾酒会』中区分不同的声音对象，这对人类来说是一项基本能力，但对当前的机器而言却仍然极具挑战！为此，本文提出一种基于课程学习策略的两阶段框架，实现了自监督下不同发声物体的判别性感知与定位。首先，我们提出在单声源场景中聚合候选声音定位结果以学习鲁棒的物体表征。进而在鸡尾酒会情景中，参考先期课程学习到的物体知识以生成不同物体的语义判别性定位图，通过将视音一致性视为自监督信息，匹配视音类别分布以滤除无声物体和选择发声对象。大量基于合成和真实多声源场景的实验表明，本文所提模型能够实现在无语义类别标注情形下，同时滤除无声物体和指出发声物体的明确位置并判定其类别属性，这在视觉多声源定位上尚属首次。

https://www.zhuanzhi.ai/paper/a3e7afb0a5c86f35871aa5269f7668ae

成为VIP会员查看完整内容

13

相关内容

NeurIPS 2020

【AAAI2021】利用先验知识对场景图进行分类

【AAAI2021】利用先验知识对场景图进行分类

专知会员服务

61+阅读 · 2020年12月3日

【NeurIPS 2020】视觉和语言表示学习的大规模对抗性训练

【NeurIPS 2020】视觉和语言表示学习的大规模对抗性训练

专知会员服务

15+阅读 · 2020年10月27日

「NeurIPS 2020」基于局部子图的图元学习

专知会员服务

46+阅读 · 2020年10月22日

【NeurIPS 2020】一种端到端全自由度抓取姿态估计网络简介

【NeurIPS 2020】一种端到端全自由度抓取姿态估计网络简介

专知会员服务

20+阅读 · 2020年10月18日

[NeurIPS 2020 oral] 基于因果干预的弱监督语义分割

专知会员服务

47+阅读 · 2020年10月5日

【ACM Multimedia 2020】共同注意力网络的自监督视听表示学习

【ACM Multimedia 2020】共同注意力网络的自监督视听表示学习

专知会员服务

28+阅读 · 2020年8月14日

【CVPR2020 旷视研究院】探索类别正则化的领域自适应对象检测

【CVPR2020 旷视研究院】探索类别正则化的领域自适应对象检测

专知会员服务

24+阅读 · 2020年4月22日

【CVPR2020-中科院计算所】弱监督语义分割的自监督等价注意力机制，Self-supervised Equivariant Attention Mechanism for Weakly Supervised Semantic Segmentation

【CVPR2020-中科院计算所】弱监督语义分割的自监督等价注意力机制，Self-supervised Equivariant Attention Mechanism for Weakly Supervised Semantic Segmentation

专知会员服务

76+阅读 · 2020年4月10日

[CVPR2020-Oral-FAIR-UIUC]使用原力，卢克!学习通过模拟效应来预测物理力

[CVPR2020-Oral-FAIR-UIUC]使用原力，卢克!学习通过模拟效应来预测物理力

专知会员服务

10+阅读 · 2020年3月27日

【元学习 | 论文】NeuralPS19，多模态模型无关元学习，南加州大学

【元学习 | 论文】NeuralPS19，多模态模型无关元学习，南加州大学

专知会员服务

62+阅读 · 2019年11月21日

被拒 ECCV 2020！AutoAssign：最强Anchor-free目标检测网络

被拒 ECCV 2020！AutoAssign：最强Anchor-free目标检测网络

CVer

15+阅读 · 2020年7月9日

【IJCV2020】通过迭代亲密学习实现弱监督语义分割

【IJCV2020】通过迭代亲密学习实现弱监督语义分割

专知

6+阅读 · 2020年2月20日

【泡泡一分钟】复杂室内环境中声源定位的自监督增量学习

【泡泡一分钟】复杂室内环境中声源定位的自监督增量学习

泡泡机器人SLAM

10+阅读 · 2019年9月9日

ICLR 2019 | 骑驴找马：利用深度强化学习模型定位新物体

ICLR 2019 | 骑驴找马：利用深度强化学习模型定位新物体

机器之心

4+阅读 · 2019年5月14日

一种小目标检测中有效的数据增强方法

一种小目标检测中有效的数据增强方法

极市平台

119+阅读 · 2019年3月23日

Google提出Grasp2Vec模型：利用自监督方法学习物体表示

Google提出Grasp2Vec模型：利用自监督方法学习物体表示

AI前线

3+阅读 · 2019年1月3日

检测与识别人与目标之间的互动

检测与识别人与目标之间的互动

极市平台

5+阅读 · 2018年10月12日

ACM MM | 中山大学等提出HSE：基于层次语义嵌入模型的精细化物体分类

ACM MM | 中山大学等提出HSE：基于层次语义嵌入模型的精细化物体分类

极市平台

4+阅读 · 2018年9月5日

ECCV 2018 | 旷视科技Oral论文解读：IoU-Net让目标检测用上定位置信度

ECCV 2018 | 旷视科技Oral论文解读：IoU-Net让目标检测用上定位置信度

机器之心

15+阅读 · 2018年8月1日

FCS 优青论坛|从个体到群智：基于群智感知的无线室内定位研究综述

FCS 优青论坛|从个体到群智：基于群智感知的无线室内定位研究综述

FCS

7+阅读 · 2018年5月11日

EarthNet2021: A novel large-scale dataset and challenge for forecasting localized climate impacts

EarthNet2021: A novel large-scale dataset and challenge for forecasting localized climate impacts

Arxiv

0+阅读 · 2020年12月11日

Unsupervised Geometric Disentanglement for Surfaces via CFAN-VAE

Arxiv

0+阅读 · 2020年12月10日

Heterogeneous Deep Graph Infomax

Heterogeneous Deep Graph Infomax

Arxiv

12+阅读 · 2019年11月19日

Optimization Models for Machine Learning: A Survey

Arxiv

18+阅读 · 2019年1月16日

MID-Fusion: Octree-based Object-Level Multi-Instance Dynamic SLAM

MID-Fusion: Octree-based Object-Level Multi-Instance Dynamic SLAM

Arxiv

8+阅读 · 2018年12月20日

One-Shot Unsupervised Cross Domain Translation

Arxiv

5+阅读 · 2018年10月23日

Video Object Detection with an Aligned Spatial-Temporal Memory

Video Object Detection with an Aligned Spatial-Temporal Memory

Arxiv

4+阅读 · 2018年7月27日

Active Metric Learning for Supervised Classification

Arxiv

9+阅读 · 2018年3月28日

AffordanceNet: An End-to-End Deep Learning Approach for Object Affordance Detection

Arxiv

3+阅读 · 2018年3月4日

Collaborative Learning for Weakly Supervised Object Detection

Arxiv

9+阅读 · 2018年2月10日

VIP会员

相关主题

相关VIP内容

【AAAI2021】利用先验知识对场景图进行分类

【AAAI2021】利用先验知识对场景图进行分类

专知会员服务

61+阅读 · 2020年12月3日

【NeurIPS 2020】视觉和语言表示学习的大规模对抗性训练

【NeurIPS 2020】视觉和语言表示学习的大规模对抗性训练

专知会员服务

15+阅读 · 2020年10月27日

「NeurIPS 2020」基于局部子图的图元学习

专知会员服务

46+阅读 · 2020年10月22日

【NeurIPS 2020】一种端到端全自由度抓取姿态估计网络简介

【NeurIPS 2020】一种端到端全自由度抓取姿态估计网络简介

专知会员服务

20+阅读 · 2020年10月18日

[NeurIPS 2020 oral] 基于因果干预的弱监督语义分割

专知会员服务

47+阅读 · 2020年10月5日

【ACM Multimedia 2020】共同注意力网络的自监督视听表示学习

【ACM Multimedia 2020】共同注意力网络的自监督视听表示学习

专知会员服务

28+阅读 · 2020年8月14日

【CVPR2020 旷视研究院】探索类别正则化的领域自适应对象检测

【CVPR2020 旷视研究院】探索类别正则化的领域自适应对象检测

专知会员服务

24+阅读 · 2020年4月22日

【CVPR2020-中科院计算所】弱监督语义分割的自监督等价注意力机制，Self-supervised Equivariant Attention Mechanism for Weakly Supervised Semantic Segmentation

【CVPR2020-中科院计算所】弱监督语义分割的自监督等价注意力机制，Self-supervised Equivariant Attention Mechanism for Weakly Supervised Semantic Segmentation

专知会员服务

76+阅读 · 2020年4月10日

[CVPR2020-Oral-FAIR-UIUC]使用原力，卢克!学习通过模拟效应来预测物理力

[CVPR2020-Oral-FAIR-UIUC]使用原力，卢克!学习通过模拟效应来预测物理力

专知会员服务

10+阅读 · 2020年3月27日

【元学习 | 论文】NeuralPS19，多模态模型无关元学习，南加州大学

【元学习 | 论文】NeuralPS19，多模态模型无关元学习，南加州大学

专知会员服务

62+阅读 · 2019年11月21日

热门VIP内容

开通专知VIP会员享更多权益服务

面向具身智能的多模态数据存储与检索：综述

《算法战争研究计划全景评估》35页

【CMU博士论文】水下三维视觉感知与生成

智能体战争：自主人工智能军备竞赛全景透视

相关资讯

被拒 ECCV 2020！AutoAssign：最强Anchor-free目标检测网络

被拒 ECCV 2020！AutoAssign：最强Anchor-free目标检测网络

CVer

15+阅读 · 2020年7月9日

【IJCV2020】通过迭代亲密学习实现弱监督语义分割

【IJCV2020】通过迭代亲密学习实现弱监督语义分割

专知

6+阅读 · 2020年2月20日

【泡泡一分钟】复杂室内环境中声源定位的自监督增量学习

【泡泡一分钟】复杂室内环境中声源定位的自监督增量学习

泡泡机器人SLAM

10+阅读 · 2019年9月9日

ICLR 2019 | 骑驴找马：利用深度强化学习模型定位新物体

ICLR 2019 | 骑驴找马：利用深度强化学习模型定位新物体

机器之心

4+阅读 · 2019年5月14日

一种小目标检测中有效的数据增强方法

一种小目标检测中有效的数据增强方法

极市平台

119+阅读 · 2019年3月23日

Google提出Grasp2Vec模型：利用自监督方法学习物体表示

Google提出Grasp2Vec模型：利用自监督方法学习物体表示

AI前线

3+阅读 · 2019年1月3日

检测与识别人与目标之间的互动

检测与识别人与目标之间的互动

极市平台

5+阅读 · 2018年10月12日

ACM MM | 中山大学等提出HSE：基于层次语义嵌入模型的精细化物体分类

ACM MM | 中山大学等提出HSE：基于层次语义嵌入模型的精细化物体分类

极市平台

4+阅读 · 2018年9月5日

ECCV 2018 | 旷视科技Oral论文解读：IoU-Net让目标检测用上定位置信度

ECCV 2018 | 旷视科技Oral论文解读：IoU-Net让目标检测用上定位置信度

机器之心

15+阅读 · 2018年8月1日

FCS 优青论坛|从个体到群智：基于群智感知的无线室内定位研究综述

FCS 优青论坛|从个体到群智：基于群智感知的无线室内定位研究综述

FCS

7+阅读 · 2018年5月11日

相关论文

EarthNet2021: A novel large-scale dataset and challenge for forecasting localized climate impacts

EarthNet2021: A novel large-scale dataset and challenge for forecasting localized climate impacts

Arxiv

0+阅读 · 2020年12月11日

Unsupervised Geometric Disentanglement for Surfaces via CFAN-VAE

Arxiv

0+阅读 · 2020年12月10日

Heterogeneous Deep Graph Infomax

Heterogeneous Deep Graph Infomax

Arxiv

12+阅读 · 2019年11月19日

Optimization Models for Machine Learning: A Survey

Arxiv

18+阅读 · 2019年1月16日

MID-Fusion: Octree-based Object-Level Multi-Instance Dynamic SLAM

MID-Fusion: Octree-based Object-Level Multi-Instance Dynamic SLAM

Arxiv

8+阅读 · 2018年12月20日

One-Shot Unsupervised Cross Domain Translation

Arxiv

5+阅读 · 2018年10月23日

Video Object Detection with an Aligned Spatial-Temporal Memory

Video Object Detection with an Aligned Spatial-Temporal Memory

Arxiv

4+阅读 · 2018年7月27日

Active Metric Learning for Supervised Classification

Arxiv

9+阅读 · 2018年3月28日

AffordanceNet: An End-to-End Deep Learning Approach for Object Affordance Detection

Arxiv

3+阅读 · 2018年3月4日

Collaborative Learning for Weakly Supervised Object Detection

Arxiv

9+阅读 · 2018年2月10日

微信扫码咨询专知VIP会员