成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
转录
关注
0
综合
百科
VIP
热门
动态
论文
精华
Large Language Model Can Transcribe Speech in Multi-Talker Scenarios with Versatile Instructions
Arxiv
0+阅读 · 4月2日
CLIP-SLA: Parameter-Efficient CLIP Adaptation for Continuous Sign Language Recognition
Arxiv
0+阅读 · 4月2日
LLM-based speaker diarization correction: A generalizable approach
Arxiv
0+阅读 · 3月17日
The Empty Chair: Using LLMs to Raise Missing Perspectives in Policy Deliberations
Arxiv
0+阅读 · 3月18日
Desirable Unfamiliarity: Insights from Eye Movements on Engagement and Readability of Dictation Interfaces
Arxiv
0+阅读 · 3月11日
Judge a Book by its Cover: Investigating Multi-Modal LLMs for Multi-Page Handwritten Document Transcription
Arxiv
0+阅读 · 2月27日
Silent Speech Sentence Recognition with Six-Axis Accelerometers using Conformer and CTC Algorithm
Arxiv
0+阅读 · 2月25日
Participant Perceptions of a Robotic Coach Conducting Positive Psychology Exercises: A Qualitative Analysis
Arxiv
0+阅读 · 2月17日
kNN Retrieval for Simple and Effective Zero-Shot Multi-speaker Text-to-Speech
Arxiv
0+阅读 · 2月3日
Unsupervised Rhythm and Voice Conversion of Dysarthric to Healthy Speech for ASR
Arxiv
0+阅读 · 1月17日
Dynamics of Toxicity in Political Podcasts
Arxiv
0+阅读 · 1月22日
ViolinDiff: Enhancing Expressive Violin Synthesis with Pitch Bend Conditioning
Arxiv
0+阅读 · 2月4日
Measuring the Effect of Transcription Noise on Downstream Language Understanding Tasks
Arxiv
0+阅读 · 2月19日
Advanced Real-Time Fraud Detection Using RAG-Based LLMs
Arxiv
0+阅读 · 1月25日
CUTECat: Concolic Execution for Computational Law
Arxiv
0+阅读 · 1月23日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top