来源:HyperAI
内容提要:DOTA 数据集是用于航拍图像中的目标检测的大型图像数据集。它可用于发现和评估航拍图像中的物体。无论从数量还是质量上来说,在同类型数据集中都具有很大优势。
目标检测一直都是计算机视觉中的一个重要而富有挑战性的问题。尽管过去十年,我们已经见证了目标检测在自然场景的重大进步,但在航拍图像领域,进展却一直很缓慢。
相对于自然图像目标检测任务,例如 COCO、VOC 数据集,其中的目标几乎都是因为重力的原因,具有比较统一的方向。
但是在遥感图像目标检测中,目标是以任意方向出现,并不容易完成精确的目标检测,例如车辆、飞机、舰船等。
遥感图像数据一般具有目标比例差异、
样本不平衡、目标方向/比率差异等特征
对此,武汉大学于 2017 年 11 月 28 日,于 arXiv 上发布论文《DOTA: A Large-scale Dataset for Object Detection in Aerial Images》,提出了一个新的遥感数据集图像目标检测数据集 DOTA 数据集。之后,于 2018 年 6 月在 IEEE 计算机视觉 和模式识别会议(CVPR)上发布。
论文地址:https://arxiv.org/pdf/1711.10398.pdf
作为计算机视觉的重要数据之一,遥感图像对于分析地球信息具有重要的作用。
遥感图像一般来自卫星,航拍图像可能来自大型飞机、无人机、直升机等。这些数据通常被用来进行计算机视觉分类、检测、分割、跟踪任务的训练,以及该领域特定的建筑重建、地物提取、地物属性(高度等)预测等。
2806 幅航拍图,15 个类别详细标注
DOTA 数据集便是用于航拍图像中目标检测的图像数据集,其被用于发现和评估航拍图像中的物体。
这些图像来源包含不同传感器和平台,包括 Google Earth、JL–1 卫星拍摄,以及中国资源卫星数据和应用中心的 GF–2 卫星拍摄。
数据集共计 2806 幅航拍图,每张图像的像素尺寸在 800*800 到 4000*4000 的范围内,其中包含不同尺度、方向和形状的物体。之后这些 DOTA 图像经由专家使用 15 个常见目标类别进行注释,包括:飞机,轮船,储罐,棒球场,网球场,篮球场,地面跑道,港口,桥梁,大型车辆,小型车辆,直升机,环形交叉路口,足球场和篮球场。
完全注释的 DOTA 图像包含 188282 个实例,每个实例均由任意四边形进行标记。
数据集中用标注有定向的边界框标注实例
以下是该数据集的详细信息:
DOTA 数据集
发布机构: 武汉大学
包含数量:2806 张航拍图片
数据格式:txt.pnd
图片尺寸:800 * 800~4000*4000
数据大小:35 GB
类别数:15 类
发布时间:2017 年 11 月
下载地址:https://hyper.ai/datasets/4920