首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

影响因子10.6的遥感领域顶刊ISPRS论文:尺度感知深度强化学习在高分辨率遥感影像分类中的应用

影响因子10.6的遥感领域顶刊ISPRS论文:Scale-aware deep reinforcement learning for high resolution remote sensing imagery classification

动动您的小手指,关注一下吧!

01 摘要

利用深度学习技术成功改进了高空间分辨率遥感影像的土地利用/土地覆盖分类。然而,目前基于深度学习的分类方法需要将遥感图像划分为较小的固定图像块,这主要是由于这些图像的广泛尺寸引起的计算限制。这种方法限制了分类网络的接受域,阻碍了对不同尺度LULC对象的处理。一个关键问题是如何利用深度学习网络自动为不同的对象选择合适的patch尺度。为了解决这一挑战,提出了一种基于深度强化学习(DRL)的规模感知分类网络(SAN)。在SAN中,每个图像补丁的状态由高空间分辨率(HSR)遥感图像的降低分辨率版本(称为“缩略图”)和位置编码表示。比例选择操作由比例控制代理执行。为了提高智能体识别当前图像补丁位置的能力,还提出了特征索引模块。该模块切换双分支分类网络的斑块尺度和上下文分支的观察区域,提取并融合多尺度图像的特征。SAN框架根据所选规模收到的映射奖励,调整网络参数以执行适当的规模选择操作。通过这种方式,SAN框架能够通过基于强化学习调整网络输入的规模来引入更合适的上下文,而不需要标记规模选择样本。使用两个公开可用的数据集和一个新建的数据集获得的实验结果表明,SAN优于以前具有固定补丁的LULC深度学习方法,特别是对于大规模地图应用。与GLNet和WiCoNet等最先进的方法相比,它们结合了全球和本地信息进行分割,以及以其先进的分割能力而闻名的CascadePSP和MagNet, SAN的准确率始终高出约10%。

02 本文拟解决的问题

1. 尺度选择问题:在高分辨率遥感图像的LULC分类中,不同的地物类型需要不同尺度的接收域来准确分类。现有的基于深度学习的方法通常需要将图像分割成较小的固定图像块,这限制了分类网络的感受野,并阻碍了对不同尺度LULC对象的处理。

2. 计算约束:高分辨率遥感图像的大小通常很大,导致计算资源的需求增加,这就需要有效的方法来处理大规模图像数据。

3. 地物尺度变化问题:地物在图像中可能以不同的尺度出现,从小型的人造设施到大型的自然地貌,这要求分类模型能够适应不同尺度的特征。

图1 HSR遥感影像LULC分类的尺度问题说明。

03 本文的创新之处

1. 尺度感知分类网络(SAN):提出了一种基于DRL的尺度感知分类框架,该框架能够自动选择不同对象的适当尺度,而不需要手动标注的尺度选择样本。

2. 尺度控制代理(Scale Control Agent):设计了一个尺度控制代理,它通过观察图像块的状态(由高分辨率图像的降采样版本和位置编码表示)来执行尺度选择动作。

3. 特征索引模块(Feature Indexing Module):提出了一个新颖的特征索引模块,以增强代理区分当前图像块位置的能力,确保精确的动作选择。

4. 上下文引导注意力机制(Context-Guide Attention Mechanism, CAM):引入了一种用于多尺度图像块分类的注意力机制,利用全局特征作为查询,局部特征作为键和值,实现特征的和谐融合。

5. 多尺度特征提取与融合:SAN框架通过双分支分类网络,一个处理局部图像块,另一个处理多尺度上下文图像块,提取并融合不同尺度的特征。

6. 端到端的优化策略:结合了监督学习和强化学习,以交替的方式训练分类网络和尺度控制代理,实现了网络参数的端到端优化。

图2 用于HSR图像分类的SAN框架流程图:尺度控制代理根据全局观测指示分类尺度。然后根据该尺度选择局部和上下文补丁,并通过多尺度分类网络进行分类。

04 方法流程

4.1 The Scale Control Agent

尺度控制代理(Scale Control Agent, SCA)包含一个策略网络,用于为每个时间步(图像块)决定合适的动作。动作空间表示上下文的尺度,分类网络读取的图像会根据动作进行相应的下采样。尺度控制代理基于全局缩略图和当前块的位置编码(positional encoding)来选择尺度。位置编码采用正弦策略生成嵌入,以捕获空间位置和嵌入信息内容。

为了增强尺度控制代理对状态差异的识别能力,提出了一个特征索引模块(feature indexing module)。该模块使用卷积神经网络提取全图像特征,并通过索引掩码(index mask)关注当前块的相关特征,确保精确的动作选择。

图3 带特征索引模块的scale cintrol agent流程图。

4.2 Scale-Variable Classification Network

双分支分类网络基于局部图像块(Local Image Patch)和多尺度上下文块(Multi-scale Context Patch)输出分类标签。上下文块通过扩展局部块的大小获得,并与局部块大小相同。网络采用双分支结构,共享一个常见的分类网络处理多尺度输入图像。提出了上下文引导注意力机制(Context-Guide Attention Mechanism, CAM),使用上下文特征作为查询,局部特征作为键和值,实现全局特征下的多尺度特征融合。

图4 Scale-variable分类的双分支网络流程图。

4.3 Agent Learning Based on Mapping Rewards

定义了SAN的马尔可夫决策过程(MDP)框架后,关键在于使用深度强化学习(DRL)技术优化尺度控制代理的参数,以最大化累积奖励。尺度控制代理的主要目标是选择适当的尺度,收集超出块边界的上下文信息,从而提高映射精度。为了鼓励合适的动作,每个块的即时奖励基于代理选择的动作的最终结果的准确度提升。

05 部分实验结果

图5 所选HSR遥感影像LULC分类数据集的可视化。

图6 同模型在GID数据集上的分类结果。

图7 不同模型在FBP数据集上的分类结果。

图8 基于本地尺度和SAN的DeepLab v3 +大尺度HSR遥感影像成图结果。

图9 不同模型在WUSU数据集上的分类结果。

图10 人工设计和SAN规模选择策略在三个数据集上的比较。

版权说明

本文中的内容全部来自论文《Scale-aware deep reinforcement learning for high resolution remote sensing imagery classification》,分享文章的目的是为了让更多刚入门的同学能够快速了解最前沿的科研动态,进而快速筛选出对自己有帮助的文献,助力科研。如有侵权,请联系本公众号立即删除。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OmjtP1lpAhQCCAHi7136SvMA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券