该数据集包括美国 50 个州 124,885,597 个计算机生成的建筑物覆盖区,并且该数据可以免费下载和使用。
Github 链接:
https://github.com/Microsoft/USBuildingFootprints
数据包括:
以 GeoJSON 格式储存的大约 1.25 亿个建筑物足迹多边形几何形状。
创作细节:
建筑物提取分两个阶段进行:
DNN 架构
网络基础是 ResNet34(https://github.com/Microsoft/CNTK/blob/master/PretrainedModels/Image.md#resnet)。为了输出产生的像素图像,微软在论文(https://arxiv.org/abs/1611.06612)中增加了 RefineNet 采样层。该模型是完全卷积的,这意味着该模型可以应用于任何大小的图像(受 GPU 内存约束,在我们的例子中为 4096x4096)。
训练细节
训练集包含 500 万个标记图像。大部分卫星图像覆盖了美国不同的住宅区。为了良好的集合表现,我们丰富了集合,包括山脉、冰川、森林、沙漠、海滩、海岸等各个区域的样本。集合中的图像为 256x256 像素大小,1 英尺/像素分辨率。使用 32 个 GPU 通过 CNTK 完成培训。
度量
这些是我们用于跟踪 DNN 模型改进的中间阶段指标,它们是基于像素的。评估集上的像素误差为 1.15%。 像素召回/精度 = 94.5%/ 94.5%。
方法说明
微软开发了一种方法,将预测像素图像近似为多边形,并根据整个预测特征空间做出决策。这和类似 Douglas-Peucker 这样的标准算法不一样,其本质上是贪婪算法。该方法试图施加一些修道院建筑物属性,目前,这些属性是手动定义和自动调整的。其中一些先验属性是:
在不久的将来,微软将寻求从现有的建筑信息中自动推断出这一点。
度量
建立匹配指标