成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
MOS
关注
0
综合
百科
VIP
热门
动态
论文
精华
Enabling Auditory Large Language Models for Automatic Speech Quality Evaluation
Arxiv
0+阅读 · 4月1日
Enhance Generation Quality of Flow Matching V2A Model via Multi-Step CoT-Like Guidance and Combined Preference Optimization
Arxiv
0+阅读 · 3月28日
Scaling Rich Style-Prompted Text-to-Speech Datasets
Arxiv
0+阅读 · 3月6日
Audio Large Language Models Can Be Descriptive Speech Quality Evaluators
Arxiv
0+阅读 · 3月12日
Find Everything: A General Vision Language Model Approach to Multi-Object Search
Arxiv
0+阅读 · 3月2日
Temporal Overlapping Prediction: A Self-supervised Pre-training Method for LiDAR Moving Object Segmentation
Arxiv
0+阅读 · 3月10日
OVAMOS: A Framework for Open-Vocabulary Multi-Object Search in Unknown Environments
Arxiv
0+阅读 · 3月3日
The Codec Language Model-based Zero-Shot Spontaneous Style TTS System for CoVoC Challenge 2024
Arxiv
0+阅读 · 2月4日
Audio Large Language Models Can Be Descriptive Speech Quality Evaluators
Arxiv
0+阅读 · 1月27日
MOS-Attack: A Scalable Multi-objective Adversarial Attack Framework
Arxiv
0+阅读 · 1月23日
IE-Bench: Advancing the Measurement of Text-Driven Image Editing for Human Perception Alignment
Arxiv
0+阅读 · 1月17日
Semi-intrusive audio evaluation: Casting non-intrusive assessment as a multi-modal text prediction task
Arxiv
0+阅读 · 1月21日
Language Barriers: Evaluating Cross-Lingual Performance of CNN and Transformer Architectures for Speech Quality Estimation
Arxiv
0+阅读 · 2月18日
BASIC: Semi-supervised Multi-organ Segmentation with Balanced Subclass Regularization and Semantic-conflict Penalty
Arxiv
0+阅读 · 1月7日
MOS-Attack: A Scalable Multi-objective Adversarial Attack Framework
Arxiv
0+阅读 · 1月13日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top