成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
GPT-4V
关注
1
综合
百科
VIP
热门
动态
论文
精华
CMMMU: A Chinese Massive Multi-discipline Multimodal Understanding Benchmark
Arxiv
0+阅读 · 11月4日
VILA$^2$: VILA Augmented VILA
Arxiv
0+阅读 · 10月31日
FlexGen: Flexible Multi-View Generation from Text and Image Inputs
Arxiv
0+阅读 · 10月14日
Movie101v2: Improved Movie Narration Benchmark
Arxiv
0+阅读 · 10月18日
GPT-4V Cannot Generate Radiology Reports Yet
Arxiv
0+阅读 · 10月9日
HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale
Arxiv
0+阅读 · 9月30日
GPT-4V(ision) for Robotics: Multimodal Task Planning from Human Demonstration
Arxiv
0+阅读 · 9月26日
HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale
Arxiv
0+阅读 · 9月25日
An Evaluation of GPT-4V for Transcribing the Urban Renewal Hand-Written Collection
Arxiv
0+阅读 · 9月11日
Hidden flaws behind expert-level accuracy of multimodal GPT-4 vision in medicine
Arxiv
0+阅读 · 8月31日
HuatuoGPT-Vision, Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale
Arxiv
0+阅读 · 9月15日
ReLEP: A Novel Framework for Real-world Long-horizon Embodied Planning
Arxiv
0+阅读 · 9月24日
CMMMU: A Chinese Massive Multi-discipline Multimodal Understanding Benchmark
Arxiv
0+阅读 · 9月9日
Image-to-Text Logic Jailbreak: Your Imagination can Help You Do Anything
Arxiv
0+阅读 · 8月26日
Can Large Language Models Automatically Jailbreak GPT-4V?
Arxiv
0+阅读 · 8月23日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top