成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
边界框
关注
0
综合
百科
VIP
热门
动态
论文
精华
Grounded Video Caption Generation
Arxiv
0+阅读 · 11月12日
MAN TruckScenes: A multimodal dataset for autonomous trucking in diverse conditions
Arxiv
0+阅读 · 11月11日
Evaluation of Environmental Conditions on Object Detection using Oriented Bounding Boxes for AR Applications
Arxiv
0+阅读 · 11月11日
Bounding Boxes and Probabilistic Graphical Models: Video Anomaly Detection Simplified
Arxiv
0+阅读 · 11月8日
Pose2Trajectory: Using Transformers on Body Pose to Predict Tennis Player's Trajectory
Arxiv
0+阅读 · 11月7日
IFAdapter: Instance Feature Control for Grounded Text-to-Image Generation
Arxiv
0+阅读 · 11月6日
Advanced computer vision for extracting georeferenced vehicle trajectories from drone imagery
Arxiv
0+阅读 · 11月4日
ManiBox: Enhancing Spatial Grasping Generalization via Scalable Simulation Data Generation
Arxiv
0+阅读 · 11月4日
GrounDiT: Grounding Diffusion Transformers via Noisy Patch Transplantation
Arxiv
0+阅读 · 11月1日
STONE: A Submodular Optimization Framework for Active 3D Object Detection
Arxiv
0+阅读 · 11月1日
Shelf-Supervised Cross-Modal Pre-Training for 3D Object Detection
Arxiv
0+阅读 · 10月15日
VLM-Grounder: A VLM Agent for Zero-Shot 3D Visual Grounding
Arxiv
0+阅读 · 10月17日
POLO -- Point-based, multi-class animal detection
Arxiv
0+阅读 · 10月15日
DreamVideo-2: Zero-Shot Subject-Driven Video Customization with Precise Motion Control
Arxiv
0+阅读 · 10月17日
ViConsFormer: Constituting Meaningful Phrases of Scene Texts using Transformer-based Method in Vietnamese Text-based Visual Question Answering
Arxiv
0+阅读 · 10月24日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top