成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
图像字幕
关注
14
图像字幕(Image Captioning),是指从图像生成文本描述的过程,主要根据图像中物体和物体的动作。
综合
百科
VIP
热门
动态
论文
精华
CIC: A framework for Culturally-aware Image Captioning
Arxiv
0+阅读 · 5月2日
The Pyramid of Captions
Arxiv
0+阅读 · 5月1日
EAMA : Entity-Aware Multimodal Alignment Based Approach for News Image Captioning
Arxiv
0+阅读 · 4月30日
The Solution for the CVPR2024 NICE Image Captioning Challenge
Arxiv
0+阅读 · 4月29日
Learning text-to-video retrieval from image captioning
Arxiv
0+阅读 · 4月26日
OmniSearchSage: Multi-Task Multi-Entity Embeddings for Pinterest Search
Arxiv
0+阅读 · 4月25日
Mitigating Open-Vocabulary Caption Hallucinations
Arxiv
0+阅读 · 4月19日
MM-PhyRLHF: Reinforcement Learning Framework for Multimodal Physics Question-Answering
Arxiv
0+阅读 · 4月19日
The Solution for the CVPR2024 NICE Image Captioning Challenge
Arxiv
0+阅读 · 4月19日
Harnessing the Power of Large Vision Language Models for Synthetic Image Detection
Arxiv
0+阅读 · 4月3日
Enhancing Visual Question Answering through Question-Driven Image Captions as Prompts
Arxiv
0+阅读 · 4月12日
Vision-Language Models in Remote Sensing: Current Progress and Future Trends
Arxiv
0+阅读 · 4月2日
View Selection for 3D Captioning via Diffusion Ranking
Arxiv
0+阅读 · 4月11日
Visual Hallucination: Definition, Quantification, and Prescriptive Remediations
Arxiv
0+阅读 · 3月31日
Embedded Heterogeneous Attention Transformer for Cross-lingual Image Captioning
Arxiv
0+阅读 · 4月5日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top