1、AI模型从单模态向多模态演进,未来有望实现认知智能: AI模型走向多模态必然性的三大因素:跨模态任务需求+跨模态数据融合+对人类认知能力的模拟。 2、多模态AI融合多种数据,可大幅延伸应用场景: 多模态AI能够实现基于文本、语音、图片、视频等多模态数据的综合处理应用,完成跨模态领域任务。 3、多模态AI五大技术环节,模态融合为核心: 多模态AI以模态融合为核心技术环节,围绕“表征-翻译-对齐-融合-联合学习”五大技术环节,解决实际场景下复杂问题的多模态解任务。 4、国内外多模态AI布局进展,关注OpenAI及谷歌动向: 国内外大厂及科研院所自2021年起相继推出跨模态AI模型,目前OpenAI及谷歌(DeepMind)布局较完善,未来有望基于各任务模型,构建多模态AI生态。