成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
语音学
关注
7
语音学(phonetics):语言学的语音学(linguistic phonetics),实验语音学,音法学(基础音法学、共时音法学、演化音法学)。 语音学中较受公认的三大分支:发音语音学(articulatory phonetics, 肺、喉、唇舌等说者发音器官的位置、形状、动作),声学语音学(acoustic phonetics, 语音声波的频率、响度等频谱-时间的性质),听觉语音学(auditory phonetics, 听觉系统对语音如何接受、分类、识别);三者范畴间的对应程度/协调,印象记音与仪器分析的对应程度/协调
综合
百科
VIP
热门
动态
论文
精华
VoiceDiT: Dual-Condition Diffusion Transformer for Environment-Aware Speech Synthesis
Arxiv
0+阅读 · 2024年12月26日
CycleFlow: Leveraging Cycle Consistency in Flow Matching for Speaker Style Adaptation
Arxiv
0+阅读 · 1月3日
Classifier-Guided Captioning Across Modalities
Arxiv
0+阅读 · 1月3日
Subband Splitting: Simple, Efficient and Effective Technique for Solving Block Permutation Problem in Determined Blind Source Separation
Arxiv
0+阅读 · 1月13日
Discrete Speech Unit Extraction via Independent Component Analysis
Arxiv
0+阅读 · 1月11日
Ensemble of classifiers for speech evaluation
Arxiv
0+阅读 · 2024年12月29日
Samba-ASR: State-Of-The-Art Speech Recognition Leveraging Structured State-Space Models
Arxiv
0+阅读 · 1月7日
Samba-asr state-of-the-art speech recognition leveraging structured state-space models
Arxiv
0+阅读 · 1月6日
Samba-ASR: State-Of-The-Art Speech Recognition Leveraging Structured State-Space Models
Arxiv
0+阅读 · 1月8日
NeuroIncept Decoder for High-Fidelity Speech Reconstruction from Neural Activity
Arxiv
0+阅读 · 1月7日
Evaluating Interval-based Tokenization for Pitch Representation in Symbolic Music Analysis
Arxiv
0+阅读 · 1月8日
A Non-autoregressive Model for Joint STT and TTS
Arxiv
0+阅读 · 1月15日
Tri-Ergon: Fine-grained Video-to-Audio Generation with Multi-modal Conditions and LUFS Control
Arxiv
0+阅读 · 2024年12月29日
SongGLM: Lyric-to-Melody Generation with 2D Alignment Encoding and Multi-Task Pre-Training
Arxiv
0+阅读 · 2024年12月24日
OmniChat: Enhancing Spoken Dialogue Systems with Scalable Synthetic Data for Diverse Scenarios
Arxiv
0+阅读 · 1月2日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top