成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
图像字幕
关注
14
图像字幕(Image Captioning),是指从图像生成文本描述的过程,主要根据图像中物体和物体的动作。
综合
百科
VIP
热门
动态
论文
精华
Reframing Image Difference Captioning with BLIP2IDC and Synthetic Augmentation
Arxiv
0+阅读 · 12月20日
User-Aware Prefix-Tuning is a Good Learner for Personalized Image Captioning
Arxiv
0+阅读 · 12月20日
JoVALE: Detecting Human Actions in Video Using Audiovisual and Language Contexts
Arxiv
0+阅读 · 12月18日
UnMA-CapSumT: Unified and Multi-Head Attention-driven Caption Summarization Transformer
Arxiv
0+阅读 · 12月16日
Causal Graphical Models for Vision-Language Compositional Understanding
Arxiv
0+阅读 · 12月12日
Altogether: Image Captioning via Re-aligning Alt-text
Arxiv
0+阅读 · 12月12日
AICAttack: Adversarial Image Captioning Attack with Attention-Based Optimization
Arxiv
0+阅读 · 12月11日
Benchmarking Large Vision-Language Models via Directed Scene Graph for Comprehensive Image Captioning
Arxiv
0+阅读 · 12月12日
Benchmarking Large Vision-Language Models via Directed Scene Graph for Comprehensive Image Captioning
Arxiv
0+阅读 · 12月11日
CIC: A Framework for Culturally-Aware Image Captioning
Arxiv
0+阅读 · 12月9日
Personalizing Multimodal Large Language Models for Image Captioning: An Experimental Analysis
Arxiv
0+阅读 · 12月4日
GenChaR: A Dataset for Stock Chart Captioning
Arxiv
0+阅读 · 12月5日
Leveraging LLMs for On-the-Fly Instruction Guided Image Editing
Arxiv
0+阅读 · 12月4日
Yo'LLaVA: Your Personalized Language and Vision Assistant
Arxiv
0+阅读 · 12月4日
CoMat: Aligning Text-to-Image Diffusion Model with Image-to-Text Concept Matching
Arxiv
0+阅读 · 11月27日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top