首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >如何从GPS定位还原公主坟高架桥地图?

如何从GPS定位还原公主坟高架桥地图?

作者头像
AI科技评论
发布2020-02-27 15:51:52
1.1K0
发布2020-02-27 15:51:52
举报
文章被收录于专栏:AI科技评论AI科技评论
作者 | 姜蔚蔚

编辑 | 贾伟

随着打车软件、导航应用的兴起,数字地图在我们的生活中发挥着越来越重要的作用。然而,传统的数字地图采集方式既费时又费力。最近几年来,我们的移动设备收集了大量的GPS轨迹信息,能否利用这些轨迹信息来生成地图呢?这不是一个简单的任务。如图1所示,(a)表示的是北京某一个路口的地图,(b)是采用点云生成的地图,无法区分不同的车道,(c)是通过GPS点连成的线段,会产生大量冗余的路段。

图1. 使用GPS轨迹生成地图的示例。

尽管存在一些挑战,过去的研究中仍然提出了三类从GPS轨迹生成地图的方法:

1)基于聚类的方法,基于距离或方向的相似度对路口进行聚类,然后相连得到路段;

2)基于轨迹合并的方法,将每一段轨迹合并到已经存在的路段或者创建新的路段;

3)基于核密度估计的方法,首先在点云上进行核密度估计,然后再生成轨迹。

前两类方法在GPS采样密度低的时候,会生成大量不存在的“捷径”,而第三类方法则会把大量临近的路段合并成一个。

下载链接:http://urban-computing.com/pdf/AAAI-RuanS.361.pdf

为了解决不同采样频率的轨迹和平行路段带来的问题,西电、京东等单位在发表于AAAI 2020 的这篇论文中,提出了一个名为DeepMG的基于深度学习的地图生成框架,包含了两个模块:

1)几何变换,从两个视图提取轨迹的特征,并且用一个名为T2RNet的轨迹-路段转换模型基于这些特征预测路段中心线;

2)拓扑构建,从预测的路段中心线提取图结构,将不同的路段进行更好的连接。

大量实验证明了DeepMG要优于以往的地图生成方法。

一、框架

这篇论文提出的DeepMG框架如图2所示。

图2. DeepMG框架示意图。

1、几何变换

1)特征提取

与以往的研究类似,这篇论文将感兴趣的区域划分为

个网格,并把每个小网格视作一个个样本点,然后从空间视图和转换视图两个角度提取特征。

DeepMG中用到了四类空间特征:(1)点:每个网格中的GPS点密度;(2)线:每个网格中的连线数量;(3)速度:每个网络内的平均移动速度;(4)方向:8个方向上的移动数量,例如东南、东等。这样空间特征可以被表示一个11维的向量,网格的空间视图即

DeepMG中也用到了邻近网格的变换视图,即通过二值矩阵来表示是否有出度和入度

的关系。当两个连续的GPS点连接了一个邻居网格与当前网格,那么它们之间的入-矩阵元素值为1,否则为0。类似的,当两个连续的GPS点连接了当前网络与一个邻居网格,那么它们之间的出-矩阵元素值为1,否则为0。由于这两个矩阵往往是稀疏的,因此DeepMG通过参数T来控制邻居网格的大小,即使用一个更低的空间分辨率,由此得到的变换视图可以表示为

,其中

表示二值矩阵。

2)T2RNet

如图3所示,T2RNet会基于提取的特征预测道路区域。

图3. T2RNet结构。

T2RNet包含4个部分,它们的任务分别是:

(1)Transition Embedding: 用全连接层将稀疏矩阵

转换成一个更加密集的表示

,其中 k 是嵌入纬度的大小;

(2)Shared Encoder:将特征在不同程度上进行编码;

(3)Road Region Decoder:给定上一步中的编码信息,预测道路区域;

(4)Road Centerline Decoder:同时利用第2步和第3步中的信息,预测道路的中心线。

预测的道路中心线可以通过两个网格之间的0-1变量来表示,即

。类似的,道路区域可以表示为

。为了解决道路中心线预测时

正负样本不均衡的问题,DeepMG采用了Dice loss[1]作为损失函数,如下所示:

最终的优化目标为:

其中

是不同目标之间的权重系数。

2、拓扑构建

几何变换模块预测的道路中心线还存在不连续和断裂的情况,并不能称得上是地图。为了解决这个问题,拓扑构建模块会连接断裂的路段,并且同时推断道路的行驶方向。

1)图提取

首先利用前人的合成方法[2]生成一个初始的无向地图。

2)连接生成

在这一步,DeepMG会利用启发式算法1,来生成所有路段之间的连接。在两种情况下会为某一个边的端点

在半径

内生成一个新的连接:(1)这条边从端点

延伸出去会与另一条边相交,此时会生成新的结点

,以及

之间的连接;(2)交点不存在,但是

与离

最近的结点

之间有一个平滑的连接,例如夹角不超过90度,此时也会在

之间形成新的连接。如图4(a)所示,

和边

、边

点之间都会形成新的连接,但是不会跟边

形成新的连接。

算法1. 连接生成的启发式算法流程。

图4. (a) 连接生成的过程示意;(b)不希望的捷径示意。

3)地图精炼

这一步中,那些不被经常经过的边和生成的连接会被删除。直接通过地图匹配[3]的方式会产生如图4(b)所示的捷径的问题,因为一般的地图匹配算法会倾向于使用最短路径,即图4(b)中的Path 1,而Path 2更像是一条真实的路径,因为它经过了更多的边。为了减少对这种捷径的选取,作者们对生成的连接乘以一个大于1的惩罚系数

,使得地图匹配算法更多地利用已有的边,而不是生成的连接。

二、实验

这篇论文使用了两种不同采样频率的GPS数据集,如表1所示,其中TaxiBJ来自于T-Drive[4],而TaxiJN来自于济南政府的非公开数据集。公开的OpenStreetMap被用作真实的基准值。

表1. 数据描述。

这篇论文衡量了生成的地图与OpenStreetMap之间的准确率,主要以平均的F1分数为指标。由于准确率会取决于几何和拓扑,这篇论文采用了跟以往工作[5]类似的评估方法,即从道路上的一个随机位置出发,找到一个最大半径内可以达到的网格。可以到达的网格标记为1,否则为0。在评估时,网格的大小被取为5米到20米,随机采样200个起始点,并且在最大半径设为2千米。

这篇论文将DeepMG与5个地图重建的基准方法进行了比较:Edelkamp [6], Chen [7], Kharita [8], Cao [9], Biagionai [10]。前三个基准方法是基于聚类的,第四个方法是基于轨迹合并的,第五个方法是基于核密度估计的。作者们也比较了不包含拓扑构建的DeepMG,记作DeepMG-nt.

图5中给出了不同方法的F1分数。相对于表现最好的基准方法,DeepMG在TaxiBJ和TaxiJN上分别取得了32.3%和6.5%的提升。由于北京市的GPS轨迹采样频率更低,DeepMG在TaxiBJ取得了更大的提升。DeepMG-nt与DeepMG的比较也显示了拓扑构建的贡献。

图5. 不同方法的F1分数。

图6给出了公主坟附近的地图构建的结果比较,可以直观地看到DeepMG的结果更加合理,能够在不产生冗余的情况下生成平行的路段。

‍‍p‍图6. 公主坟的地图构建结果比较。

这篇论文也对不同模块分别进行了评估。首先在几何变换模块中,作者们将T2RNet中的编码-解码部分替换成另外6种网络结构:FCN [11], LinkNet [12], DeepLabV3+ [13], UNet [14], D-LinkNet [15], LinkNet + 1D Decoder [16]。结果如表2所示,从F1分数来看,FCN表现最差,而T2RNet好于其他所有方法。

表2. 不同数据集上的模型比较。

作者们也比较了优化目标中的权重系数

的影响,结果如图7所示,当

为0.2时效果最好。

图7.

的影响评估。

为了比较不同特征的影响,作者们比较了不同特征组合的影响,即P(仅点特征),L(仅线特征),S(仅空间视图特征)和A(所有特征),结果如表3所示,采用所有特征时能够得到最好的结果。

表3. 不同特征组合的影响。

最后在拓扑构建模块中,作者们评估了不同的惩罚因子

的影响,如图8所示。当

过小时,会生成很多不存在的捷径,而当

过大时,则会遗留很多中断的路段,因此作者们最终采用了

为1.4。

图8.

的影响。

三、结论

这篇论文提出了一个名为DeepMG的基于深度学习的地图生成框架,在真实的北京和济南的GPS数据集上,相对于最优的基准方法,分别取得了32.3%和6.5%的性能提升。大量的实验和参数的分析也表明了DeepMG得到了很好的优化。

参考:

[1] Milletari, F.; Navab, N.; and Ahmadi, S.-A. 2016. V-net: Fully convolutional neural networks for volumetric medical image segmentation. In 3DV, 565–571. IEEE.

[2] Shi, W.; Shen, S.; and Liu, Y. 2009. Automatic generation of road network map from massive gps, vehicle trajectories. In ITSC, 1–6. IEEE.

[3] Yuan, J.; Zheng, Y.; Zhang, C.; Xie, X.; and Sun, G.-Z. 2010b. An interactive-voting based map matching algorithm. In MDM, 43–52. IEEE Computer Society.

[4] Yuan, J.; Zheng, Y.; Zhang, C.; Xie, W.; Xie, X.; Sun, G.; and Huang, Y. 2010a. T-drive: driving directions based on taxi trajectories. In SIGSPATIAL, 99–108. ACM.

[5] Biagioni, J., and Eriksson, J. 2012a. Inferring road maps from global positioning system traces: Survey and comparative evaluation. TRANSPORT RES REC 2291(1):61–71.

[6] Edelkamp, S., and Schr¨odl, S. 2003. Route planning and map inference with global positioning traces. In Computer science in perspective. Springer. 128–151.

[7] Chen, C.; Lu, C.; Huang, Q.; Yang, Q.; Gunopulos, D.; and Guibas, L. 2016. City-scale map creation and updating using gps collections. In SIGKDD, 1465–1474. ACM.

[8] Stanojevic, R.; Abbar, S.; Thirumuruganathan, S.; Chawla, S.; Filali, F.; and Aleimat, A. 2018. Robust road map inference through network alignment of trajectories. In ICDM, 135–143. SIAM.

[9] Cao, L., and Krumm, J. 2009. From gps traces to a routable road map. In SIGSPATIAL, 3–12. ACM.

[10] Biagioni, J., and Eriksson, J. 2012b. Map inference in the face of noise and disparity. In SIGSPATIAL, 79–88. ACM.

[11] Long, J.; Shelhamer, E.; and Darrell, T. 2015. Fully convolutional networks for semantic segmentation. In CVPR, 3431–3440.

[12] Chaurasia, A., and Culurciello, E. 2017. Linknet: Exploiting encoder representations for efficient semantic segmentation. In VCIP, 1–4. IEEE.

[13] Chen, L.-C.; Papandreou, G.; Kokkinos, I.; Murphy, K.; and Yuille, A. L. 2017. Deeplab: Semantic image segmentation with deep convolutional nets, atrous convolution, and fully connected crfs. TPAMI 40(4):834–848.

[14] Ronneberger, O.; Fischer, P.; and Brox, T. 2015. U-net: Convolutional networks for biomedical image segmentation. In MICCAI, 234–241. Springer.

[15] Zhou, L.; Zhang, C.; and Wu, M. 2018. D-linknet: Linknet with pretrained encoder and dilated convolution for high resolution satellite imagery road extraction. In CVPR Workshops, 182–186.

[16] Sun, T.; Di, Z.; Che, P.; Liu, C.; and Wang, Y. 2019. Leveraging crowdsourced gps data for road extraction from aerial imagery. In CVPR, 7509–7518.

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-02-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI科技评论 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、框架
  • 二、实验
  • 三、结论
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档