成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
GPT-4V
关注
1
综合
百科
VIP
热门
动态
论文
精华
RLAIF-V: Open-Source AI Feedback Leads to Super GPT-4V Trustworthiness
Arxiv
0+阅读 · 2024年12月29日
Improved GUI Grounding via Iterative Narrowing
Arxiv
1+阅读 · 2024年12月20日
Red Teaming GPT-4V: Are GPT-4V Safe Against Uni/Multi-Modal Jailbreak Attacks?
Arxiv
1+阅读 · 2024年12月15日
From Concept to Manufacturing: Evaluating Vision-Language Models for Engineering Design
Arxiv
0+阅读 · 2024年12月9日
Improved GUI Grounding via Iterative Narrowing
Arxiv
0+阅读 · 2024年12月9日
A Survey on Multimodal Large Language Models
Arxiv
0+阅读 · 2024年11月29日
A Survey on Multimodal Large Language Models
Arxiv
0+阅读 · 2024年11月26日
Improved GUI Grounding via Iterative Narrowing
Arxiv
0+阅读 · 2024年11月24日
GPT-4V Cannot Generate Radiology Reports Yet
Arxiv
0+阅读 · 2024年11月14日
MMLongBench-Doc: Benchmarking Long-context Document Understanding with Visualizations
Arxiv
0+阅读 · 2024年11月12日
GPT-4V Cannot Generate Radiology Reports Yet
Arxiv
0+阅读 · 2024年11月6日
CMMMU: A Chinese Massive Multi-discipline Multimodal Understanding Benchmark
Arxiv
0+阅读 · 2024年11月4日
VILA$^2$: VILA Augmented VILA
Arxiv
0+阅读 · 2024年10月31日
FlexGen: Flexible Multi-View Generation from Text and Image Inputs
Arxiv
0+阅读 · 2024年10月14日
Movie101v2: Improved Movie Narration Benchmark
Arxiv
0+阅读 · 2024年10月18日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top