全球权威声纹识别竞赛斩获双料冠军 网易AI Lab智能技术领先国际

2020 年 7 月 25 日 量子位
允中 发自 凹非寺
量子位 报道 | 公众号 QbitAI

中国力量,又双叒夺冠了。

这一次,是在全球规模最大、最全面的语音顶会INTERSPEECH 2020上。

挑战比拼内容,则是当前语音研究领域最火热的议题之一——“声纹识别”。

最新公布成绩的SdSV声纹识别比赛中,网易AI Lab从众多国际顶级队伍中脱颖而出,获文本相关声纹识别赛道综合排名第一、单模型第一的双料冠军。

SdSV声纹识别比赛是业界权威性赛事,参赛队伍来自全球多所知名高校与企业,包括近两年全球各项声纹识别比赛中的“常胜将军”:布尔诺工业大学、新加坡通信研究院、约翰霍普金斯大学等。

能在与众多好手的较量中脱颖而出,网易AI着实秀了一把技术“肌肉”。

网易AI如何夺冠?

SdSV Challege 2020的主要目的,是评估在短时场景下针对文本相关(TD)和文本无关(TI)说话者验证(SV)的新技术。

今年,全球共有67支队伍注册参与挑战。

比赛中,网易 AI Lab基于常见的X-Vector和PLDA算法,创新地提出了一种ASR-free的文本相关声纹识别算法。

相比传统的Deep Speaker Embedding方法,该算法不需要依赖语音识别,就能够在多语言环境下,同时完成说话人和文本内容的验证。

比赛采用MinDCF(最小检测代价)和EER(等错误率)作为评测指标。

网易AI Lab的单模型在两个指标均为最佳,其中EER达到了1.67%,相比第二名降低了11.6%,并远低于比赛 X-Vector基线系统(EER=9.05%)。

网易AI Lab

这样的好成绩,对于网易AI Lab来说,并不是福至心灵的运气,而是确有长期的技术积累。

声纹识别是生物识别技术的一种,也称为说话人识别,是一种通过声音判别说话人身份的技术。

目前,人工智能主要有三个研究方向:视觉识别、智能语音、NLP自然语言处理。

其中,在语音研究领域,声纹识别属于相对蓝海市场,解决的主要是“我是我”的身份认证问题,多应用在安全验证场景。

从近几年的市场趋势来看,银行,金融服务,保险已成为声纹识别应用的领导领域。

可以说,随着技术的不断成熟和融合,声纹识别技术正在逐渐融入日常生活,像指纹识别、面部识别一样成为人人触手可及的AI技术。应用潜力巨大。

而成立于2017年的网易 AI Lab,早已将声纹识别技术运用到了游戏场景中。

除了进行游戏身份验证,还能够针对音色对用户进行分类、丰富玩家画像,从而更加精准地为玩家推荐志趣相投的好友、匹配实力相当的对手,为玩家带来更好的游戏体验。

目前,网易AI Lab在杭州、广州、上海均设有分部,主要运用AI黑科技为旗下各大游戏工作室助力,并赋能给更多产品。

总的来说,网易AI Lab的研究方向包括三大方面:

  • 计算机视觉和图形学研究

  • 语音语言处理研究

  • 游戏AI研究

当前,已有不少研发技术处于行业领先地位,并接入了多款游戏。

在前不久刚刚落幕的2020世界人工智能大会上,网易CEO丁磊曾表示,人工智能选对了应用场景,发挥的效率就会非常高。

而新鲜摘下的冠军果实,也彰显了网易AI的技术能力。

网易AI,未来可期。

—  —

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

报名 | 智慧生活行业私享会

欢迎报名,与峰瑞资本、石头科技、网易有道、思必驰、九号机器人、视感科技、云丁科技等企业高管,共同探讨如何借力资本市场、把握行业趋势,打造全场景智慧生活:


量子位 QbitAI · 头条号签约作者


վ'ᴗ' ի 追踪AI技术和产品新动态


喜欢就点「在看」吧 !



登录查看更多
2

相关内容

说话人识别(Speaker Recognition),或者称为声纹识别(Voiceprint Recognition, VPR),是根据语音中所包含的说话人个性信息,利用计算机以及现在的信息识别技术,自动鉴别说话人身份的一种生物特征识别技术。 说话人识别研究的目的就是从语音中提取具有说话人表征性的特征,建立有 效的模型和系统,实现自动精准的说话人鉴别。
《2020人工智能医疗产业发展蓝皮书》发布
专知会员服务
113+阅读 · 2020年9月11日
最新《深度学习人脸识别》综述论文,
专知会员服务
67+阅读 · 2020年8月10日
人机对抗智能技术
专知会员服务
201+阅读 · 2020年5月3日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
301+阅读 · 2019年12月23日
经验分享 | 2018夏威夷 水面无人艇 全球竞赛
计算机视觉life
16+阅读 · 2019年7月1日
过了尬吹的年代,人工智能都落地了些什么?
互联网er的早读课
8+阅读 · 2018年11月5日
竹间智能出席亚马逊AWS技术峰会,共建AI对话机器人生态
“看脸”的时代,AI到底有多智能?
微软丹棱街5号
3+阅读 · 2017年11月9日
Arxiv
14+阅读 · 2020年9月1日
Hierarchy Parsing for Image Captioning
Arxiv
6+阅读 · 2019年9月10日
Arxiv
5+阅读 · 2019年4月25日
Arxiv
6+阅读 · 2018年11月1日
Arxiv
7+阅读 · 2018年3月22日
Arxiv
5+阅读 · 2018年3月6日
VIP会员
相关资讯
相关论文
Arxiv
14+阅读 · 2020年9月1日
Hierarchy Parsing for Image Captioning
Arxiv
6+阅读 · 2019年9月10日
Arxiv
5+阅读 · 2019年4月25日
Arxiv
6+阅读 · 2018年11月1日
Arxiv
7+阅读 · 2018年3月22日
Arxiv
5+阅读 · 2018年3月6日
Top
微信扫码咨询专知VIP会员