Geo-spatial analysis of our world benefits from a multimodal approach, as every single geographic location can be described in numerous ways (images from various viewpoints, textual descriptions, and geographic coordinates). Current geo-spatial benchmarks have limited coverage across modalities, considerably restricting progress in the field, as current approaches cannot integrate all relevant modalities within a unified framework. We introduce the Multi-Modal Landmark dataset (MMLANDMARKS), a benchmark composed of four modalities: 197k highresolution aerial images, 329k ground-view images, textual information, and geographic coordinates for 18,557 distinct landmarks in the United States. The MMLANDMARKS dataset has a one-to-one correspondence across every modality, which enables training and benchmarking models for various geo-spatial tasks, including cross-view Ground-to-Satellite retrieval, ground and satellite geolocalization, Text-to-Image, and Text-to-GPS retrieval. We demonstrate broad generalization and competitive performance against off-the-shelf foundational models and specialized state-of-the-art models across different tasks by employing a simple CLIP-inspired baseline, illustrating the necessity for multimodal datasets to achieve broad geo-spatial understanding.


翻译:对世界的分析得益于多模态方法,因为每个地理位置都可以通过多种方式进行描述(不同视角的图像、文本描述以及地理坐标)。当前的地理空间基准数据集在模态覆盖上较为有限,这极大地限制了该领域的进展,因为现有方法无法将所有相关模态整合到一个统一的框架中。我们提出了多模态地标数据集(MMLANDMARKS),这是一个包含四种模态的基准:针对美国18,557个不同地标的197k张高分辨率航拍图像、329k张地面视角图像、文本信息以及地理坐标。MMLANDMARKS数据集在所有模态间具有一一对应关系,这使得能够为多种地理空间任务训练和评估模型,包括跨视角的地面到卫星检索、地面与卫星地理定位、文本到图像检索以及文本到GPS检索。通过采用一个简单的受CLIP启发的基线模型,我们在不同任务中展示了相对于现成的基础模型和专用前沿模型的广泛泛化能力和有竞争力的性能,从而说明了实现广泛地理空间理解需要多模态数据集。

0
下载
关闭预览

相关内容

UTC: 用于视觉对话的任务间对比学习的统一Transformer
专知会员服务
14+阅读 · 2022年5月4日
【NAACL2021】信息解缠正则化持续学习的文本分类
专知会员服务
22+阅读 · 2021年4月11日
AAAI 2022 | ProtGNN:自解释图神经网络
专知
10+阅读 · 2022年2月28日
【ICML2021】因果匹配领域泛化
专知
12+阅读 · 2021年8月12日
【NeurIPS2019】图变换网络:Graph Transformer Network
国家自然科学基金
1+阅读 · 2016年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
VIP会员
相关VIP内容
相关资讯
相关基金
国家自然科学基金
1+阅读 · 2016年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员