成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
多模态大模型
关注
22
综合
百科
VIP
热门
动态
论文
精华
CVPR 2025 Highlight | OmniManip:以对象为中心的机器人通用操作框架
专知会员服务
9+阅读 · 4月15日
SVBench:首个流视频长上下文理解评估基准|ICLR'2025 Spotlight
专知会员服务
10+阅读 · 4月9日
ICLR 2025 | 多模态大模型总"胡说八道"?「定位-修正」实现生成过程的幻觉抑制
专知会员服务
16+阅读 · 3月26日
【伯克利博士论文】迈向视觉-语言基础模型:局限、改进与泛化
专知会员服务
27+阅读 · 3月12日
多模态基础模型的机制可解释性综述
专知会员服务
30+阅读 · 2月28日
DeepSeek发布新款开源多模态AI模型Janus-Pro,超越 DALL-E 3 与 Stable Diffusion
专知会员服务
34+阅读 · 1月28日
【HKUST博士论文】从查询到提示:走向开放世界感知
专知会员服务
21+阅读 · 1月17日
【AAAI2025】通过现成的多模态大型语言模型进行零样本视频时刻检索
专知会员服务
16+阅读 · 1月16日
2024年移动端AI应用场景研究报告,35页ppt
专知会员服务
29+阅读 · 1月12日
多模态RAG技术:从语义抽取到VLM应用与规模化挑战
专知会员服务
37+阅读 · 1月1日
大规模多模态模型数据集、应用类别与分类学综述
专知会员服务
55+阅读 · 2024年12月25日
李飞飞、谢赛宁新作「空间智能」 等探索多模态大模型性能
专知会员服务
25+阅读 · 2024年12月24日
浅谈多模态大模型幻觉缓解方法
专知会员服务
23+阅读 · 2024年12月17日
迈向可解释和可理解的多模态大规模语言模型
专知会员服务
38+阅读 · 2024年12月7日
如何构建o1模型推理能力?清华北大等提出LLaVA-o1: 让视觉语言模型逐步推理
专知会员服务
30+阅读 · 2024年11月19日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top