成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
转录
关注
0
综合
百科
VIP
热门
动态
论文
精华
From TOWER to SPIRE: Adding the Speech Modality to a Translation-Specialist LLM
Arxiv
0+阅读 · 10月22日
One Size Fits All? A Modular Adaptive Sanitization Kit (MASK) for Customizable Privacy-Preserving Phone Scam Detection
Arxiv
0+阅读 · 10月21日
Do Audio LLMs Really LISTEN, or Just Transcribe? Measuring Lexical vs. Acoustic Emotion Cues Reliance
Arxiv
0+阅读 · 10月17日
Cost Analysis of Human-corrected Transcription for Predominately Oral Languages
Arxiv
0+阅读 · 10月14日
Augmenting Human-Centered Racial Covenant Detection and Georeferencing with Plug-and-Play NLP Pipelines
Arxiv
0+阅读 · 10月9日
Phonikud: Hebrew Grapheme-to-Phoneme Conversion for Real-Time Text-to-Speech
Arxiv
0+阅读 · 10月10日
Transcribing Rhythmic Patterns of the Guitar Track in Polyphonic Music
Arxiv
0+阅读 · 10月7日
How I Built ASR for Endangered Languages with a Spoken Dictionary
Arxiv
0+阅读 · 10月6日
Transcribe, Translate, or Transliterate: An Investigation of Intermediate Representations in Spoken Language Models
Arxiv
0+阅读 · 10月2日
From TOWER to SPIRE: Adding the Speech Modality to a Text-Only LLM
Arxiv
0+阅读 · 10月3日
EvolveCaptions: Empowering DHH Users Through Real-Time Collaborative Captioning
Arxiv
0+阅读 · 10月2日
MOSS-Speech: Towards True Speech-to-Speech Models Without Text Guidance
Arxiv
0+阅读 · 10月2日
VioPTT: Violin Technique-Aware Transcription from Synthetic Data Augmentation
Arxiv
0+阅读 · 9月30日
VioPTT: Violin Technique-Aware Transcription from Synthetic Data Augmentation
Arxiv
0+阅读 · 9月28日
End-to-End Full-Page Optical Music Recognition for Pianoform Sheet Music
Arxiv
0+阅读 · 6月27日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top