成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
语音识别
关注
0
语音识别是计算机科学和计算语言学的一个跨学科子领域,它发展了一些方法和技术,使计算机可以将口语识别和翻译成文本。 它也被称为自动语音识别(ASR),计算机语音识别或语音转文本(STT)。它整合了计算机科学,语言学和计算机工程领域的知识和研究。
综合
百科
VIP
热门
动态
论文
精华
Jointly Recognizing Speech and Singing Voices Based on Multi-Task Audio Source Separation
Arxiv
0+阅读 · 4月17日
Anatomy of Industrial Scale Multilingual ASR
Arxiv
0+阅读 · 4月16日
Deferred NAM: Low-latency Top-K Context Injection via DeferredContext Encoding for Non-Streaming ASR
Arxiv
0+阅读 · 4月15日
Conformer-1: Robust ASR via Large-Scale Semisupervised Bootstrapping
Arxiv
0+阅读 · 4月12日
Conformer-1: Robust ASR via Large-Scale Semisupervised Bootstrapping
Arxiv
0+阅读 · 4月10日
MLCA-AVSR: Multi-Layer Cross Attention Fusion based Audio-Visual Speech Recognition
Arxiv
0+阅读 · 4月8日
Automatic Restoration of Diacritics for Speech Data Sets
Arxiv
0+阅读 · 4月7日
A Comparison of Speech Data Augmentation Methods Using S3PRL Toolkit
Arxiv
0+阅读 · 3月29日
Multi-Stage Multi-Modal Pre-Training for Automatic Speech Recognition
Arxiv
0+阅读 · 3月28日
Safeguarding Voice Privacy: Harnessing Near-Ultrasonic Interference To Protect Against Unauthorized Audio Recording
Arxiv
0+阅读 · 4月7日
BRAVEn: Improving Self-Supervised Pre-training for Visual and Auditory Speech Recognition
Arxiv
0+阅读 · 4月2日
Zipformer: A faster and better encoder for automatic speech recognition
Arxiv
0+阅读 · 4月10日
AmpleGCG: Learning a Universal and Transferable Generative Model of Adversarial Suffixes for Jailbreaking Both Open and Closed LLMs
Arxiv
0+阅读 · 4月11日
Echotune: A Modular Extractor Leveraging the Variable-Length Nature of Speech in ASR Tasks
Arxiv
0+阅读 · 4月8日
ASR advancements for indigenous languages: Quechua, Guarani, Bribri, Kotiria, and Wa'ikhana
Arxiv
0+阅读 · 4月12日
参考链接
父主题
模式识别
语音技术
子主题
科大讯飞
Cortana
小i机器人
Siri
云知声
Nuance
语音助手
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top