Github 项目推荐 | 阿里开源自主研发的 DFSMN 语音识别模型，引谷歌论文引用 - 专知

会员服务 ·

0

Github 项目推荐 | 阿里开源自主研发的 DFSMN 语音识别模型，引谷歌论文引用

2018 年 6 月 7 日 AI研习社

近日，阿里巴巴达摩院机器智能实验室语音识别团队，推出了新一代语音识别模型—— DFSMN，不仅被谷歌等国外巨头在论文中重点引用，更将全球语音识别准确率纪录提高至 96.04%（基于世界最大的免费语音识别数据库LibriSpeech）。

阿里在GitHub平台上开源了自主研发的DFSMN语音识别模型

这支平均年龄只有 30 岁的团队还宣布，即日起向全世界企业与个人开源此次打破全球语音识别纪录的 DFSMN 模型，使全球开发者都能共享这一成果，共同推进人工智能技术的发展。这也使 DFSMN有望继传统的 LSTM 模型后，成为全球语音识别领域最主要的声学识别模型之一，全球语音识别准确率也有望总体提高 10%。

著名语音识别专家，西北工业大学教授谢磊表示：「阿里此次开源的 DFSMN 模型，在语音识别准确率上的稳定提升是突破性的。是近年来深度学习在语音识别领域最具代表性的成果之一。对全球学术界和AI技术应用都有巨大影响。」

语音识别是人机交互中的核心技术，在智能音响、智能家居、机器人及自动驾驶等领域都有广泛应用。在刚刚结束的云栖大会武汉峰会上，装有 DFSMN 语音识别模型的「AI收银员」在与真人店员的 PK 中，在嘈杂环境下准确识别了用户的语音点单，在短短 49 秒内点了 34 杯咖啡。此外，装备这一语音识别技术的自动售票机也已在上海地铁「上岗」。

DFSMN 语音识别模型，对比目前业界使用最为广泛的 LSTM 模型，训练速度更快、识别准确率更高。采用全新 DFSMN 模型的智能音响或智能家居设备，相比前代技术深度学习训练速度提到了 3 倍，语音识别速度提高了 2 倍。

Github 链接：

https://github.com/alibaba/Alibaba-MIT-Speech

从Python入门-如何成为AI工程师

BAT资深算法工程师独家研发课程

最贴近生活与工作的好玩实操项目

班级管理助学搭配专业的助教答疑

学以致用拿offer，学完即推荐就业

如何用 RNN 实现语音识别？

▼▼▼

登录查看更多

9

相关内容

语音识别

语音识别是计算机科学和计算语言学的一个跨学科子领域，它发展了一些方法和技术，使计算机可以将口语识别和翻译成文本。它也被称为自动语音识别（ASR），计算机语音识别或语音转文本（STT）。它整合了计算机科学，语言学和计算机工程领域的知识和研究。

AAAI 2020 | 滴滴&东北大学提出自动结构化剪枝压缩算法框架，性能提升高达120倍

专知会员服务

30+阅读 · 2020年2月26日

【斯坦福&Google】面向机器人的机器学习，63页PPT

【斯坦福&Google】面向机器人的机器学习，63页PPT

专知会员服务

26+阅读 · 2019年11月19日

问答与对话-理论与基础之面向自然语言处理的深度学习基础【邱锡鹏】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第13期

问答与对话-理论与基础之面向自然语言处理的深度学习基础【邱锡鹏】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第13期

专知会员服务

48+阅读 · 2019年10月21日

斯坦福&谷歌Jeff Dean最新Nature论文：医疗深度学习技术指南

斯坦福&谷歌Jeff Dean最新Nature论文：医疗深度学习技术指南

专知会员服务

58+阅读 · 2019年10月20日

复旦大学邱锡鹏老师《神经网络与深度学习》书册最新版

复旦大学邱锡鹏老师《神经网络与深度学习》书册最新版

专知会员服务

65+阅读 · 2019年10月9日

阿里开源人机对话模型ESIM，达摩院90后科学家研发，曾创世界纪录

阿里开源人机对话模型ESIM，达摩院90后科学家研发，曾创世界纪录

量子位

5+阅读 · 2019年7月7日

机器学习开源项目Top10

机器学习开源项目Top10

AI100

4+阅读 · 2019年1月20日

阿里巴巴语音识别模型 DFSMN 使用指南

阿里巴巴语音识别模型 DFSMN 使用指南

人工智能头条

10+阅读 · 2018年12月13日

Mozilla发布开源语音数据库和语音识别模型

Mozilla发布开源语音数据库和语音识别模型

Python程序员

3+阅读 · 2017年12月1日

推荐｜学“深度强化学习”，看懂DeepMind这篇文章就够了!(PPT)

推荐｜学“深度强化学习”，看懂DeepMind这篇文章就够了!(PPT)

全球人工智能

5+阅读 · 2017年10月3日

Learning Graph Embedding with Adversarial Training Methods

Learning Graph Embedding with Adversarial Training Methods

Arxiv

6+阅读 · 2019年1月4日

ShuffleNet V2: Practical Guidelines for Efficient CNN Architecture Design

ShuffleNet V2: Practical Guidelines for Efficient CNN Architecture Design

Arxiv

4+阅读 · 2018年7月30日

Auto Deep Compression by Reinforcement Learning Based Actor-Critic Structure

Auto Deep Compression by Reinforcement Learning Based Actor-Critic Structure

Arxiv

3+阅读 · 2018年7月8日

On the Robustness of the CVPR 2018 White-Box Adversarial Example Defenses

Arxiv

3+阅读 · 2018年4月10日

Facial Aging and Rejuvenation by Conditional Multi-Adversarial Autoencoder with Ordinal Regression

Arxiv

5+阅读 · 2018年4月8日

VIP会员

相关主题

阿里巴巴达摩院

相关VIP内容

AAAI 2020 | 滴滴&东北大学提出自动结构化剪枝压缩算法框架，性能提升高达120倍

专知会员服务

30+阅读 · 2020年2月26日

【斯坦福&Google】面向机器人的机器学习，63页PPT

【斯坦福&Google】面向机器人的机器学习，63页PPT

专知会员服务

26+阅读 · 2019年11月19日

问答与对话-理论与基础之面向自然语言处理的深度学习基础【邱锡鹏】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第13期

问答与对话-理论与基础之面向自然语言处理的深度学习基础【邱锡鹏】第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿科技讲习班》ATT第13期

专知会员服务

48+阅读 · 2019年10月21日

斯坦福&谷歌Jeff Dean最新Nature论文：医疗深度学习技术指南

斯坦福&谷歌Jeff Dean最新Nature论文：医疗深度学习技术指南

专知会员服务

58+阅读 · 2019年10月20日

复旦大学邱锡鹏老师《神经网络与深度学习》书册最新版

复旦大学邱锡鹏老师《神经网络与深度学习》书册最新版

专知会员服务

65+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

《无人机系统 - 反无人机系统：测试方法》364页

《无人机蜂群攻击防御的预测建模：面向美军战备的人工智能轨迹预测与最优拦截策略设计》最新报告

美军低成本无人作战攻击系统（LUCAS）：扩大无人机战争规模

《将空中力量带向海洋：美国海军航空发展的四条竞争路径及其教训》报告

相关资讯

阿里开源人机对话模型ESIM，达摩院90后科学家研发，曾创世界纪录

阿里开源人机对话模型ESIM，达摩院90后科学家研发，曾创世界纪录

量子位

5+阅读 · 2019年7月7日

机器学习开源项目Top10

机器学习开源项目Top10

AI100

4+阅读 · 2019年1月20日

阿里巴巴语音识别模型 DFSMN 使用指南

阿里巴巴语音识别模型 DFSMN 使用指南

人工智能头条

10+阅读 · 2018年12月13日

Mozilla发布开源语音数据库和语音识别模型

Mozilla发布开源语音数据库和语音识别模型

Python程序员

3+阅读 · 2017年12月1日

推荐｜学“深度强化学习”，看懂DeepMind这篇文章就够了!(PPT)

推荐｜学“深度强化学习”，看懂DeepMind这篇文章就够了!(PPT)

全球人工智能

5+阅读 · 2017年10月3日

相关论文

Learning Graph Embedding with Adversarial Training Methods

Learning Graph Embedding with Adversarial Training Methods

Arxiv

6+阅读 · 2019年1月4日

ShuffleNet V2: Practical Guidelines for Efficient CNN Architecture Design

ShuffleNet V2: Practical Guidelines for Efficient CNN Architecture Design

Arxiv

4+阅读 · 2018年7月30日

Auto Deep Compression by Reinforcement Learning Based Actor-Critic Structure

Auto Deep Compression by Reinforcement Learning Based Actor-Critic Structure

Arxiv

3+阅读 · 2018年7月8日

On the Robustness of the CVPR 2018 White-Box Adversarial Example Defenses

Arxiv

3+阅读 · 2018年4月10日

Facial Aging and Rejuvenation by Conditional Multi-Adversarial Autoencoder with Ordinal Regression

Arxiv

5+阅读 · 2018年4月8日

大家都在搜

蓝牙安全攻防

大型语言模型

朱克爱德华兹家族

模型压缩 | 知识蒸馏经典解读

微信扫码咨询专知VIP会员