成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
语音识别
关注
753
语音识别是计算机科学和计算语言学的一个跨学科子领域,它发展了一些方法和技术,使计算机可以将口语识别和翻译成文本。 它也被称为自动语音识别(ASR),计算机语音识别或语音转文本(STT)。它整合了计算机科学,语言学和计算机工程领域的知识和研究。
综合
百科
VIP
热门
动态
论文
精华
Comparing Self-Supervised Learning Models Pre-Trained on Human Speech and Animal Vocalizations for Bioacoustics Processing
Arxiv
0+阅读 · 1月10日
Discrete Speech Unit Extraction via Independent Component Analysis
Arxiv
0+阅读 · 1月11日
Generalized and Efficient 2D Gaussian Splatting for Arbitrary-scale Super-Resolution
Arxiv
0+阅读 · 1月14日
Samba-ASR: State-Of-The-Art Speech Recognition Leveraging Structured State-Space Models
Arxiv
0+阅读 · 1月7日
Samba-asr state-of-the-art speech recognition leveraging structured state-space models
Arxiv
0+阅读 · 1月6日
Samba-ASR: State-Of-The-Art Speech Recognition Leveraging Structured State-Space Models
Arxiv
0+阅读 · 1月8日
UV-Attack: Physical-World Adversarial Attacks for Person Detection via Dynamic-NeRF-based UV Mapping
Arxiv
0+阅读 · 1月10日
AdaCS: Adaptive Normalization for Enhanced Code-Switching ASR
Arxiv
0+阅读 · 1月13日
Fotheidil: an Automatic Transcription System for the Irish Language
Arxiv
0+阅读 · 2024年12月31日
LUPET: Incorporating Hierarchical Information Path into Multilingual ASR
Arxiv
0+阅读 · 1月9日
Target Speaker ASR with Whisper
Arxiv
0+阅读 · 1月16日
Whisper Turns Stronger: Augmenting Wav2Vec 2.0 for Superior ASR in Low-Resource Languages
Arxiv
0+阅读 · 2024年12月31日
DiCoW: Diarization-Conditioned Whisper for Target Speaker Automatic Speech Recognition
Arxiv
0+阅读 · 2024年12月30日
DCIM-AVSR : Efficient Audio-Visual Speech Recognition via Dual Conformer Interaction Module
Arxiv
0+阅读 · 1月8日
Improving Zero-Shot Chinese-English Code-Switching ASR with kNN-CTC and Gated Monolingual Datastores
Arxiv
0+阅读 · 1月12日
参考链接
父主题
模式识别
语音技术
子主题
科大讯飞
Cortana
小i机器人
Siri
云知声
Nuance
语音助手
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top