在过去的几年里,Meta AI产生了一系列的研究项目,每个项目都解决了多模态感知的一个重要挑战从解决用于训练的公开可用数据的短缺(Hateful 的模因),到为视觉、语音和文本创建单一算法(Data2vec),到建立跨多个任务工作的基础模型(FLAVA),到找到正确的模型参数(Omnivore),以及其他许多。综合来看,它们代表了一个明显的趋势: 在不久的将来,对多模态的理解将对更智能的AI系统至关重要。