第三次DIHARD Diarization挑战 (The Third DIHARD Diarization Challenge) - 专知论文

会员服务 ·

0

INTERACT · 张成子空间 · 稳健性 · 值域 · 噪声 ·

2021 年 1 月 27 日

The Third DIHARD Diarization Challenge

翻译：第三次DIHARD Diarization挑战

Neville Ryant,Prachi Singh,Venkat Krishnamohan,Rajat Varma,Kenneth Church,Christopher Cieri,Jun Du,Sriram Ganapathy,Mark Liberman

from arxiv, arXiv admin note: text overlap with arXiv:1906.07839

This paper introduces the third DIHARD challenge, the third in a series of speaker diarization challenges intended to improve the robustness of diarization systems to variation in recording equipment, noise conditions, and conversational domain. Speaker diarization is evaluated under two segmentation conditions (diarization from a reference speech segmentation vs. diarization from scratch) and 11 diverse domains. The domains span a range of recording conditions and interaction types, including read audiobooks, meeting speech, clinical interviews, web videos, and, for the first time, conversational telephone speech. We describe the task and metrics, challenge design, datasets, and baseline systems for speech speech activity detection and diarization.

翻译：本文介绍了第三次DIHARD挑战,这是一系列演讲人对二分法挑战中的第三个挑战,其目的是提高二分法系统的稳健性,以改变记录设备、噪音条件和对话领域;议长对二分法进行了两个分解条件(从参考语音分解分解分解到零分解到零分解)和11个不同领域的评价;这些领域涉及一系列记录条件和互动类型,包括阅读音频书籍、会议演讲、临床访谈、网络视频,以及第一次交谈电话发言;我们描述了语音活动探测和分解的任务和衡量标准、挑战设计、数据集和基线系统。

0

相关内容

INTERACT

IFIP TC13 Conference on Human-Computer Interaction是人机交互领域的研究者和实践者展示其工作的重要平台。多年来，这些会议吸引了来自几个国家和文化的研究人员。官网链接：http://interact2019.org/

最新《自监督表示学习》报告，70页ppt

最新《自监督表示学习》报告，70页ppt

专知会员服务

86+阅读 · 2020年12月22日

【经典书】概率理论：科学逻辑，95页pdf

【经典书】概率理论：科学逻辑，95页pdf

专知会员服务

78+阅读 · 2020年10月18日

IJCAI2020接受论文列表，592篇论文pdf都在这了！

IJCAI2020接受论文列表，592篇论文pdf都在这了！

专知会员服务

64+阅读 · 2020年7月16日

ACL2020接受论文列表公布，571篇长文208篇短文

ACL2020接受论文列表公布，571篇长文208篇短文

专知会员服务

67+阅读 · 2020年5月19日

【IJCAI2020】统计相关模型，A Complete Characterization of Projectivity for Statistical Relational Models

【IJCAI2020】统计相关模型，A Complete Characterization of Projectivity for Statistical Relational Models

专知会员服务

20+阅读 · 2020年4月25日

【北邮-腾讯AI】自监督学习音视觉说话人认证，Self-supervised learning for audio-visual speaker diarization

【北邮-腾讯AI】自监督学习音视觉说话人认证，Self-supervised learning for audio-visual speaker diarization

专知会员服务

26+阅读 · 2020年2月16日

【图像分割| 2019最新综述】自然图像和医学图像的深层语义分割，附21页PDF（Deep Semantic Segmentation of Natural and Medical Images: A Review）

【图像分割| 2019最新综述】自然图像和医学图像的深层语义分割，附21页PDF（Deep Semantic Segmentation of Natural and Medical Images: A Review）

专知会员服务

54+阅读 · 2019年11月16日

Deep Learning Based Detection and Correction of Cardiac MR Motion Artefacts During Reconstruction for High-Quality Segmentation

Deep Learning Based Detection and Correction of Cardiac MR Motion Artefacts During Reconstruction for High-Quality Segmentation

专知会员服务

59+阅读 · 2019年10月17日

【哈佛大学商学院课程Fall 2019】机器学习可解释性

【哈佛大学商学院课程Fall 2019】机器学习可解释性

专知会员服务

105+阅读 · 2019年10月9日

最新BERT相关论文清单，BERT-related Papers

最新BERT相关论文清单，BERT-related Papers

专知会员服务

53+阅读 · 2019年9月29日

CCF推荐 | 国际会议信息10条

CCF推荐 | 国际会议信息10条

Call4Papers

8+阅读 · 2019年5月27日

CCF推荐 | 国际会议信息8条

CCF推荐 | 国际会议信息8条

Call4Papers

9+阅读 · 2019年5月23日

计算机 | 中低难度国际会议信息6条

计算机 | 中低难度国际会议信息6条

Call4Papers

7+阅读 · 2019年5月16日

计算机 | EMNLP 2019等国际会议信息6条

计算机 | EMNLP 2019等国际会议信息6条

Call4Papers

18+阅读 · 2019年4月26日

计算机 | CCF推荐期刊专刊信息5条

计算机 | CCF推荐期刊专刊信息5条

Call4Papers

3+阅读 · 2019年4月10日

计算机类 | ISCC 2019等国际会议信息9条

计算机类 | ISCC 2019等国际会议信息9条

Call4Papers

5+阅读 · 2018年12月25日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

计算机类 | 期刊专刊截稿信息9条

计算机类 | 期刊专刊截稿信息9条

Call4Papers

4+阅读 · 2018年1月26日

计算机类 | 国际会议信息7条

计算机类 | 国际会议信息7条

Call4Papers

3+阅读 · 2017年11月17日

【今日新增】计算机领域国际会议截稿信息

【今日新增】计算机领域国际会议截稿信息

Call4Papers

9+阅读 · 2017年7月21日

CUHK-EE voice cloning system for ICASSP 2021 M2VoC challenge

CUHK-EE voice cloning system for ICASSP 2021 M2VoC challenge

Arxiv

0+阅读 · 2021年3月24日

Polarization Guided Specular Reflection Separation

Arxiv

0+阅读 · 2021年3月22日

Project-Level Encoding for Neural Source Code Summarization of Subroutines

Arxiv

0+阅读 · 2021年3月22日

An Empirical Study of Developer Discussions on Low-Code Software Development Challenges

Arxiv

0+阅读 · 2021年3月21日

USTC-NELSLIP System Description for DIHARD-III Challenge

Arxiv

0+阅读 · 2021年3月19日

Addressing Hate Speech with Data Science: An Overview from Computer Science Perspective

Arxiv

0+阅读 · 2021年3月18日

Towards Robust Visual Information Extraction in Real World: New Dataset and Novel Solution

Arxiv

10+阅读 · 2021年1月24日

Recent Advances and Challenges in Task-oriented Dialog System

Recent Advances and Challenges in Task-oriented Dialog System

Arxiv

18+阅读 · 2020年3月19日

Charades-Ego: A Large-Scale Dataset of Paired Third and First Person Videos

Arxiv

4+阅读 · 2018年4月30日

Vision Meets Drones: A Challenge

Arxiv

6+阅读 · 2018年4月23日

VIP会员

文章信息

相关主题

张成子空间

相关VIP内容

最新《自监督表示学习》报告，70页ppt

最新《自监督表示学习》报告，70页ppt

专知会员服务

86+阅读 · 2020年12月22日

【经典书】概率理论：科学逻辑，95页pdf

【经典书】概率理论：科学逻辑，95页pdf

专知会员服务

78+阅读 · 2020年10月18日

IJCAI2020接受论文列表，592篇论文pdf都在这了！

IJCAI2020接受论文列表，592篇论文pdf都在这了！

专知会员服务

64+阅读 · 2020年7月16日

ACL2020接受论文列表公布，571篇长文208篇短文

ACL2020接受论文列表公布，571篇长文208篇短文

专知会员服务

67+阅读 · 2020年5月19日

【IJCAI2020】统计相关模型，A Complete Characterization of Projectivity for Statistical Relational Models

【IJCAI2020】统计相关模型，A Complete Characterization of Projectivity for Statistical Relational Models

专知会员服务

20+阅读 · 2020年4月25日

【北邮-腾讯AI】自监督学习音视觉说话人认证，Self-supervised learning for audio-visual speaker diarization

【北邮-腾讯AI】自监督学习音视觉说话人认证，Self-supervised learning for audio-visual speaker diarization

专知会员服务

26+阅读 · 2020年2月16日

【图像分割| 2019最新综述】自然图像和医学图像的深层语义分割，附21页PDF（Deep Semantic Segmentation of Natural and Medical Images: A Review）

【图像分割| 2019最新综述】自然图像和医学图像的深层语义分割，附21页PDF（Deep Semantic Segmentation of Natural and Medical Images: A Review）

专知会员服务

54+阅读 · 2019年11月16日

Deep Learning Based Detection and Correction of Cardiac MR Motion Artefacts During Reconstruction for High-Quality Segmentation

Deep Learning Based Detection and Correction of Cardiac MR Motion Artefacts During Reconstruction for High-Quality Segmentation

专知会员服务

59+阅读 · 2019年10月17日

【哈佛大学商学院课程Fall 2019】机器学习可解释性

【哈佛大学商学院课程Fall 2019】机器学习可解释性

专知会员服务

105+阅读 · 2019年10月9日

最新BERT相关论文清单，BERT-related Papers

最新BERT相关论文清单，BERT-related Papers

专知会员服务

53+阅读 · 2019年9月29日

热门VIP内容

开通专知VIP会员享更多权益服务

《使用量化测量将传感器节点关联到融合中心的算法设计》171页

军事前沿模型

提升军事训练能力的最佳人工智能模拟工具

《社交媒体信息作战》最新48页技术报告

相关资讯

CCF推荐 | 国际会议信息10条

CCF推荐 | 国际会议信息10条

Call4Papers

8+阅读 · 2019年5月27日

CCF推荐 | 国际会议信息8条

CCF推荐 | 国际会议信息8条

Call4Papers

9+阅读 · 2019年5月23日

计算机 | 中低难度国际会议信息6条

计算机 | 中低难度国际会议信息6条

Call4Papers

7+阅读 · 2019年5月16日

计算机 | EMNLP 2019等国际会议信息6条

计算机 | EMNLP 2019等国际会议信息6条

Call4Papers

18+阅读 · 2019年4月26日

计算机 | CCF推荐期刊专刊信息5条

计算机 | CCF推荐期刊专刊信息5条

Call4Papers

3+阅读 · 2019年4月10日

计算机类 | ISCC 2019等国际会议信息9条

计算机类 | ISCC 2019等国际会议信息9条

Call4Papers

5+阅读 · 2018年12月25日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

计算机类 | 期刊专刊截稿信息9条

计算机类 | 期刊专刊截稿信息9条

Call4Papers

4+阅读 · 2018年1月26日

计算机类 | 国际会议信息7条

计算机类 | 国际会议信息7条

Call4Papers

3+阅读 · 2017年11月17日

【今日新增】计算机领域国际会议截稿信息

【今日新增】计算机领域国际会议截稿信息

Call4Papers

9+阅读 · 2017年7月21日

相关论文

CUHK-EE voice cloning system for ICASSP 2021 M2VoC challenge

CUHK-EE voice cloning system for ICASSP 2021 M2VoC challenge

Arxiv

0+阅读 · 2021年3月24日

Polarization Guided Specular Reflection Separation

Arxiv

0+阅读 · 2021年3月22日

Project-Level Encoding for Neural Source Code Summarization of Subroutines

Arxiv

0+阅读 · 2021年3月22日

An Empirical Study of Developer Discussions on Low-Code Software Development Challenges

Arxiv

0+阅读 · 2021年3月21日

USTC-NELSLIP System Description for DIHARD-III Challenge

Arxiv

0+阅读 · 2021年3月19日

Addressing Hate Speech with Data Science: An Overview from Computer Science Perspective

Arxiv

0+阅读 · 2021年3月18日

Towards Robust Visual Information Extraction in Real World: New Dataset and Novel Solution

Arxiv

10+阅读 · 2021年1月24日

Recent Advances and Challenges in Task-oriented Dialog System

Recent Advances and Challenges in Task-oriented Dialog System

Arxiv

18+阅读 · 2020年3月19日

Charades-Ego: A Large-Scale Dataset of Paired Third and First Person Videos

Arxiv

4+阅读 · 2018年4月30日

Vision Meets Drones: A Challenge

Arxiv

6+阅读 · 2018年4月23日

微信扫码咨询专知VIP会员