成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
图像字幕
关注
14
图像字幕(Image Captioning),是指从图像生成文本描述的过程,主要根据图像中物体和物体的动作。
综合
百科
VIP
热门
动态
论文
精华
Unleashing Text-to-Image Diffusion Prior for Zero-Shot Image Captioning
Arxiv
0+阅读 · 2024年12月31日
Evaluating Image Caption via Cycle-consistent Text-to-Image Generation
Arxiv
0+阅读 · 1月8日
Evaluating Image Caption via Cycle-consistent Text-to-Image Generation
Arxiv
0+阅读 · 1月7日
VCRScore: Image captioning metric based on V\&L Transformers, CLIP, and precision-recall
Arxiv
0+阅读 · 1月15日
Valley2: Exploring Multimodal Models with Scalable Vision-Language Design
Arxiv
0+阅读 · 1月10日
Valley2: Exploring Multimodal Models with Scalable Vision-Language Design
Arxiv
0+阅读 · 1月13日
Improving Image Captioning by Mimicking Human Reformulation Feedback at Inference-time
Arxiv
0+阅读 · 1月8日
RadAlign: Advancing Radiology Report Generation with Vision-Language Concept Alignment
Arxiv
0+阅读 · 1月13日
ViPCap: Retrieval Text-Based Visual Prompts for Lightweight Image Captioning
Arxiv
0+阅读 · 2024年12月30日
ViPCap: Retrieval Text-Based Visual Prompts for Lightweight Image Captioning
Arxiv
0+阅读 · 2024年12月26日
Toward Robust Hyper-Detailed Image Captioning: A Multiagent Approach and Dual Evaluation Metrics for Factuality and Coverage
Arxiv
0+阅读 · 2024年12月24日
MoColl: Agent-Based Specific and General Model Collaboration for Image Captioning
Arxiv
0+阅读 · 1月3日
MoColl: Agent-Based Specific and General Model Collaboration for Image Captioning
Arxiv
0+阅读 · 1月10日
Reframing Image Difference Captioning with BLIP2IDC and Synthetic Augmentation
Arxiv
1+阅读 · 2024年12月20日
User-Aware Prefix-Tuning is a Good Learner for Personalized Image Captioning
Arxiv
1+阅读 · 2024年12月20日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top