成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
Vision
关注
4
综合
百科
VIP
热门
动态
论文
精华
Explanatory Instructions: Towards Unified Vision Tasks Understanding and Zero-shot Generalization
Arxiv
0+阅读 · 2024年12月25日
The Key of Understanding Vision Tasks: Explanatory Instructions
Arxiv
0+阅读 · 2024年12月24日
A Novel Vision Transformer for Camera-LiDAR Fusion based Traffic Object Segmentation
Arxiv
0+阅读 · 1月6日
Comprehensive Examination of Unrolled Networks for Linear Inverse Problems
Arxiv
0+阅读 · 1月8日
A Backdoor Attack Scheme with Invisible Triggers Based on Model Architecture Modification
Arxiv
0+阅读 · 1月6日
Vision Graph Non-Contrastive Learning for Audio Deepfake Detection with Limited Labels
Arxiv
0+阅读 · 1月9日
Embodied Scene Understanding for Vision Language Models via MetaVQA
Arxiv
0+阅读 · 1月15日
FreeZe: Training-free zero-shot 6D pose estimation with geometric and vision foundation models
Arxiv
0+阅读 · 1月8日
LPViT: Low-Power Semi-structured Pruning for Vision Transformers
Arxiv
0+阅读 · 2024年12月24日
Adaptive Prompt Tuning: Vision Guided Prompt Tuning with Cross-Attention for Fine-Grained Few-Shot Learning
Arxiv
0+阅读 · 1月1日
Understanding the Practice, Perception, and Challenge of Blind or Low Vision Students Learning through Accessible Technologies in Non-Inclusive 'Blind Colleges'
Arxiv
0+阅读 · 1月13日
Benchmark Evaluations, Applications, and Challenges of Large Vision Language Models: A Survey
Arxiv
0+阅读 · 1月4日
Benchmark Evaluations, Applications, and Challenges of Large Vision Language Models: A Survey
Arxiv
0+阅读 · 1月10日
IDEA: Image Description Enhanced CLIP-Adapter
Arxiv
0+阅读 · 1月15日
ViPOcc: Leveraging Visual Priors from Vision Foundation Models for Single-View 3D Occupancy Prediction
Arxiv
0+阅读 · 1月10日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top