Github 推荐项目 | 微软发布 1.25 亿美国建筑足迹开放数据

该数据集包括美国 50 个州 124,885,597 个计算机生成的建筑物覆盖区,并且该数据可以免费下载和使用。

Github 链接:

https://github.com/Microsoft/USBuildingFootprints

FAQ

数据包括:

以 GeoJSON 格式储存的大约 1.25 亿个建筑物足迹多边形几何形状。

创作细节:

建筑物提取分两个阶段进行:

  • 语义分割 - 使用DNN识别航拍图像上的建筑像素
  • 多边化 - 将建筑像素斑点转换为多边形

语义分割:

DNN 架构

网络基础是 ResNet34(https://github.com/Microsoft/CNTK/blob/master/PretrainedModels/Image.md#resnet)。为了输出产生的像素图像,微软在论文(https://arxiv.org/abs/1611.06612)中增加了 RefineNet 采样层。该模型是完全卷积的,这意味着该模型可以应用于任何大小的图像(受 GPU 内存约束,在我们的例子中为 4096x4096)。

训练细节

训练集包含 500 万个标记图像。大部分卫星图像覆盖了美国不同的住宅区。为了良好的集合表现,我们丰富了集合,包括山脉、冰川、森林、沙漠、海滩、海岸等各个区域的样本。集合中的图像为 256x256 像素大小,1 英尺/像素分辨率。使用 32 个 GPU 通过 CNTK 完成培训。

度量

这些是我们用于跟踪 DNN 模型改进的中间阶段指标,它们是基于像素的。评估集上的像素误差为 1.15%。 像素召回/精度 = 94.5%/ 94.5%。

多边化

方法说明

微软开发了一种方法,将预测像素图像近似为多边形,并根据整个预测特征空间做出决策。这和类似 Douglas-Peucker 这样的标准算法不一样,其本质上是贪婪算法。该方法试图施加一些修道院建筑物属性,目前,这些属性是手动定义和自动调整的。其中一些先验属性是:

  • 建筑物边缘必须至少具有一定长度,包括相对长度和绝对长度,例如 3米
  • 连续的边角可能是90度
  • 连续的角度不能非常尖锐,通过一些自动调谐的阈值可以更小,例如, 30度
  • 建筑物角度可能具有非常少的主角度,意味着所有建筑物边缘形成角度(主导角度 ±nπ/ 2)

在不久的将来,微软将寻求从现有的建筑信息中自动推断出这一点。

度量

建立匹配指标

原文发布于微信公众号 - AI研习社(okweiwu)

原文发表时间:2018-07-04

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能头条

在实践中正确应用机器学习的12条法则

26140
来自专栏专知

\b【AAAI2018】通过动态融合方式学习多模态词表示,中科院自动化所宗成庆老师团队最新工作

【导读】基于文本来学习词的语义表示, 特别是基于共现的工作, 如Word2Vec能够很好的处理大多数任务, 然而, 这些语义表示和人的语义表示系统有很大出入. ...

40860
来自专栏机器之心

利用Capsule重构过程,Hinton等人实现对抗样本的自动检测

在一般的图像识别过程中,模型只是简单地输出图像的类别,而没有输出图像的特征,甚至并不能内在地、完整地表征图像。这导致了在测试中受到对抗攻击时,除非让人进行对比验...

12820
来自专栏企鹅号快讯

简析集成学习

当我们第一次接触机器学习问题的时候,面对着大量的数据和一个分类/回归的机器学习任务,我们本能地会采取这样的方式:选择一个决策树分类器或一个Lasso回归模型,将...

24890
来自专栏AI科技评论

干货 | CVPR精彩论文解读:对当下主流CNN物体检测器的对比评测

AI科技评论按:虽然CVPR 2017已经落下帷幕,但对精彩论文的解读还在继续。下文是Momenta高级研发工程师李俊对此次大会收录的Speed/Accurac...

39960
来自专栏新智元

【Bengio vs 谷歌】深度学习兄弟对决,神经网络泛化本质之争

【新智元导读】一场或许有关深度学习本质的争论正在火热进行中。去年底,MIT、DeepMind 和谷歌大脑合著的论文《理解深度学习需要重新思考泛化》引发热论。论文...

414120
来自专栏应兆康的专栏

建立一个单一数字的评估指标

16710
来自专栏人工智能

机器学习中的朴素贝叶斯算法

在处理预测相关的建模问题时你会发现朴素贝叶斯是一个简单而又强大的算法。

26560
来自专栏机器之心

学界 | 精准防御对抗性攻击,清华大学提出对抗正则化训练方法DeepDefense

33780
来自专栏LhWorld哥陪你聊算法

机器学习之线性回归

分类算法:对于x1,x2,x3,x4作为特征值,当输入到算法中得出有限个结果。比如对于银行借钱,输入年龄,性别,信誉等值 银行反馈借款或者不借款为分类指标。

25730

扫码关注云+社区

领取腾讯云代金券