成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
音素
关注
0
综合
百科
VIP
热门
动态
论文
精华
PASE: Phoneme-Aware Speech Encoder to Improve Lip Sync Accuracy for Talking Head Synthesis
Arxiv
0+阅读 · 10月15日
I Have No Mouth, and I Must Rhyme: Uncovering Internal Phonetic Representations in LLaMA 3.2
Arxiv
0+阅读 · 10月15日
FAC-FACodec: Controllable Zero-Shot Foreign Accent Conversion with Factorized Speech Codec
Arxiv
0+阅读 · 10月12日
Dual Data Scaling for Robust Two-Stage User-Defined Keyword Spotting
Arxiv
0+阅读 · 10月12日
Phonikud: Hebrew Grapheme-to-Phoneme Conversion for Real-Time Text-to-Speech
Arxiv
0+阅读 · 10月10日
ControlAudio: Tackling Text-Guided, Timing-Indicated and Intelligible Audio Generation via Progressive Diffusion Modeling
Arxiv
0+阅读 · 10月10日
METRICALARGS: A Taxonomy for Studying Metrical Poetry with LLMs
Arxiv
0+阅读 · 10月9日
MuFFIN: Multifaceted Pronunciation Feedback Model with Interactive Hierarchical Neural Modeling
Arxiv
0+阅读 · 10月7日
MuFFIN: Multifaceted Pronunciation Feedback Model with Interactive Hierarchical Neural Modeling
Arxiv
0+阅读 · 10月6日
BFA: Real-time Multilingual Text-to-speech Forced Alignment
Arxiv
0+阅读 · 9月27日
UniFlow-Audio: Unified Flow Matching for Audio Generation from Omni-Modalities
Arxiv
0+阅读 · 9月29日
IPA-CHILDES & G2P+: Feature-Rich Resources for Cross-Lingual Phonology and Phonemic Language Modeling
Arxiv
0+阅读 · 4月3日
IPA-CHILDES & G2P+: Feature-Rich Resources for Cross-Lingual Phonology and Phonemic Language Modeling
Arxiv
0+阅读 · 6月12日
IPA-CHILDES & G2P+: Feature-Rich Resources for Cross-Lingual Phonology and Phonemic Language Modeling
Arxiv
0+阅读 · 4月14日
Evaluating Logit-Based GOP Scores for Mispronunciation Detection
Arxiv
0+阅读 · 7月8日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top