成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
Vision
关注
4
综合
百科
VIP
热门
动态
论文
精华
Doubly-Universal Adversarial Perturbations: Deceiving Vision-Language Models Across Both Images and Text with a Single Perturbation
Arxiv
0+阅读 · 12月19日
Adaptive Prompt Tuning: Vision Guided Prompt Tuning with Cross-Attention for Fine-Grained Few-Shot Learning
Arxiv
0+阅读 · 12月19日
Training Datasets Generation for Machine Learning: Application to Vision Based Navigation
Arxiv
0+阅读 · 12月19日
Split Learning in Computer Vision for Semantic Segmentation Delay Minimization
Arxiv
0+阅读 · 12月18日
STRAP: Robot Sub-Trajectory Retrieval for Augmented Policy Learning
Arxiv
0+阅读 · 12月19日
AutoTrust: Benchmarking Trustworthiness in Large Vision Language Models for Autonomous Driving
Arxiv
0+阅读 · 12月19日
HarmonicEval: Multi-modal, Multi-task, Multi-criteria Automatic Evaluation Using a Vision Language Model
Arxiv
0+阅读 · 12月19日
Predictive Inverse Dynamics Models are Scalable Learners for Robotic Manipulation
Arxiv
0+阅读 · 12月19日
VHM: Versatile and Honest Vision Language Model for Remote Sensing Image Analysis
Arxiv
0+阅读 · 12月19日
Video Prediction Policy: A Generalist Robot Policy with Predictive Visual Representations
Arxiv
0+阅读 · 12月19日
FiVL: A Framework for Improved Vision-Language Alignment
Arxiv
0+阅读 · 12月19日
From Training-Free to Adaptive: Empirical Insights into MLLMs' Understanding of Detection Information
Arxiv
0+阅读 · 12月19日
What If: Causal Analysis with Graph Databases
Arxiv
0+阅读 · 12月18日
From Capture to Display: A Survey on Volumetric Video
Arxiv
0+阅读 · 12月17日
ManipGPT: Is Affordance Segmentation by Large Vision Models Enough for Articulated Object Manipulation?
Arxiv
0+阅读 · 12月18日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top