成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
GPT-4V
关注
1
综合
百科
VIP
热门
动态
论文
精华
Red Teaming GPT-4V: Are GPT-4V Safe Against Uni/Multi-Modal Jailbreak Attacks?
Arxiv
0+阅读 · 12月15日
From Concept to Manufacturing: Evaluating Vision-Language Models for Engineering Design
Arxiv
0+阅读 · 12月9日
Improved GUI Grounding via Iterative Narrowing
Arxiv
0+阅读 · 12月9日
A Survey on Multimodal Large Language Models
Arxiv
0+阅读 · 11月29日
A Survey on Multimodal Large Language Models
Arxiv
0+阅读 · 11月26日
Improved GUI Grounding via Iterative Narrowing
Arxiv
0+阅读 · 11月24日
GPT-4V Cannot Generate Radiology Reports Yet
Arxiv
0+阅读 · 11月14日
MMLongBench-Doc: Benchmarking Long-context Document Understanding with Visualizations
Arxiv
0+阅读 · 11月12日
GPT-4V Cannot Generate Radiology Reports Yet
Arxiv
0+阅读 · 11月6日
CMMMU: A Chinese Massive Multi-discipline Multimodal Understanding Benchmark
Arxiv
0+阅读 · 11月4日
VILA$^2$: VILA Augmented VILA
Arxiv
0+阅读 · 10月31日
FlexGen: Flexible Multi-View Generation from Text and Image Inputs
Arxiv
0+阅读 · 10月14日
Movie101v2: Improved Movie Narration Benchmark
Arxiv
0+阅读 · 10月18日
GPT-4V Cannot Generate Radiology Reports Yet
Arxiv
0+阅读 · 10月9日
HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale
Arxiv
0+阅读 · 9月30日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top