成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
语音识别
关注
752
语音识别是计算机科学和计算语言学的一个跨学科子领域,它发展了一些方法和技术,使计算机可以将口语识别和翻译成文本。 它也被称为自动语音识别(ASR),计算机语音识别或语音转文本(STT)。它整合了计算机科学,语言学和计算机工程领域的知识和研究。
综合
百科
VIP
热门
动态
论文
精华
Hard-Synth: Synthesizing Diverse Hard Samples for ASR using Zero-Shot TTS and LLM
Arxiv
0+阅读 · 11月20日
CAFE A Novel Code switching Dataset for Algerian Dialect French and English
Arxiv
0+阅读 · 11月20日
Whisper-Flamingo: Integrating Visual Features into Whisper for Audio-Visual Speech Recognition and Translation
Arxiv
0+阅读 · 11月19日
Whisper Finetuning on Nepali Language
Arxiv
0+阅读 · 11月19日
Child Speech Recognition in Human-Robot Interaction: Problem Solved?
Arxiv
0+阅读 · 11月19日
BanglaDialecto: An End-to-End AI-Powered Regional Speech Standardization
Arxiv
0+阅读 · 11月16日
Interactive Cycle Model -- The Linkage Combination among Automatic Speech Recognition, Large Language Models and Smart Glasses
Arxiv
0+阅读 · 11月15日
REBORN: Reinforcement-Learned Boundary Segmentation with Iterative Training for Unsupervised ASR
Arxiv
0+阅读 · 11月15日
SeMaScore : a new evaluation metric for automatic speech recognition tasks
Arxiv
0+阅读 · 11月14日
Everyone deserves their voice to be heard: Analyzing Predictive Gender Bias in ASR Models Applied to Dutch Speech Data
Arxiv
0+阅读 · 11月14日
Exploring the Potential of Multimodal LLM with Knowledge-Intensive Multimodal ASR
Arxiv
0+阅读 · 11月14日
Transferable Adversarial Attacks against ASR
Arxiv
0+阅读 · 11月14日
LLMStinger: Jailbreaking LLMs using RL fine-tuned LLMs
Arxiv
0+阅读 · 11月13日
CJST: CTC Compressor based Joint Speech and Text Training for Decoder-Only ASR
Arxiv
0+阅读 · 11月12日
DCF-DS: Deep Cascade Fusion of Diarization and Separation for Speech Recognition under Realistic Single-Channel Conditions
Arxiv
0+阅读 · 11月11日
参考链接
父主题
模式识别
语音技术
子主题
科大讯飞
Cortana
小i机器人
Siri
云知声
Nuance
语音助手
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top