悉尼科技大学等团队 | 用于裂缝检测的高性能视觉特征提取自监督模型DinoV2

文章来源：企鹅号 - 机器智能研究MIR

结构健康监测领域中，桥梁等结构表面裂缝的自动检测对保障结构完整性至关重要。传统有监督深度学习模型虽可预测裂缝尺寸与位置，但高度依赖海量精准标注数据，这一过程不仅耗时费力，在特定场景下也不具备可行性。更为关键的是，此类模型在面对全新或复杂数据集时，泛化能力与鲁棒性均较为有限。来自悉尼科技大学、西悉尼大学等机构的研究者们重点探究自监督模型DinoV2在裂缝检测应用中的潜力，尤其聚焦其作为高性能视觉特征提取器的能力。通过利用DinoV2提取图像中裂缝形态的纹理、形状、上下文等关键视觉特征，验证了该模型在无标注数据支撑的情况下，仍可高效实现裂缝检测。研究搭配线性分类头，评估了DinoV2在多种复杂背景下识别裂缝的效果，并与多款主流有监督学习模型展开对比。实验结果表明，DinoV2不仅提升了裂缝检测性能（尤其在处理无标注图像时），在高噪声、不同材质纹理等复杂场景中更展现出显著优势。本研究凸显了自监督模型在解决实际工程问题中的应用价值，为未来结构健康监测技术的发展提供了全新思路。相关成果已发表于《机器智能研究（英文）》2026年第1期中，全文开放获取。

图片来自Springer

全文下载：

Autonomous Detection of Concrete Cracks Using Self-supervised DinoV2

Taoyuan Zhu, Ali Braytee, Karthick Thiyagarajan, Xing Zi, Samir Mustapha, Xian Tao & Mukesh Prasad

https://link.springer.com/article/10.1007/s11633-025-1553-5

全文导读

裂缝检测对于延长设施使用寿命、保障公共安全具有至关重要的作用。随着人工智能技术的发展，神经网络与深度学习方法被引入裂缝检测领域，众多有监督学习算法在该任务上取得了优异效果。传统上，人工检测是结构裂缝检测的主要手段。然而，该方式不仅成本高昂，还耗时费力、劳动强度大，且容易出现人为误差。人工检测效率低下可能引发严重后果，I-35W公路大桥坍塌事故便是典型例证，不充分的检测工作可能是导致事故的诱因之一。此外，在部分环境中开展人工检测存在安全风险，会危及检测人员的生命安全。人工检测的上述局限不仅会造成经济负担，还带来了突出的安全隐患，这也凸显出研发更高效、更可靠检测方法的迫切需求。

为推动该领域技术发展，结构健康监测（SHM）已成为重要研究方向，甚至被纳入国际项目竞赛的研究课题。人工智能技术的融合应用有望克服人工检测效率低下的问题，提供更快速、更精准、更安全的替代方案。但此类技术在应用过程中也带来了一系列新挑战，尤其体现在数据需求与模型泛化能力方面。随着深度学习技术的出现与持续发展，研究者们逐步采用该技术实现更高效、更精准的裂缝检测。然而，对于有监督模型而言，这也引发了一系列突出难题。首先，数据依赖性与泛化能力问题尤为显著。现有多数裂缝检测技术高度依赖标注数据，这已成为一大主要局限。裂缝可出现在各类材料表面，甚至可能隐匿于不同环境中，例如水下污渍区域或沥青内部。数据的这种多样性要求模型能够自动适配各数据集的专属特征，但现有模型通常需要人工调整参数以优化性能。这种针对不同数据集单独调优模型的方式，会使其在面对全新未知数据集时，泛化能力与鲁棒性有所下降。具体而言，裂缝形态的多样性要求训练数据具备广泛的代表性，而多数模型需针对特定数据集手动优化参数，限制了其通用性。因此，经单独调优的模型往往难以适配未见过的新数据集，进而影响实际应用效果。其次，数据不平衡问题同样是严峻挑战。在实际裂缝检测任务中，无裂缝区域的数量通常远多于裂缝区域，由此引发严重的数据不平衡问题。对于有监督学习模型，这种不平衡会导致模型倾向于预测占比更高的类别，即无裂缝区域，从而降低对真实裂缝的检测灵敏度。这不仅会造成类别预测偏差，还会削弱实际裂缝的检测能力，增加漏检风险。此外，这种数据失衡还会导致传统评价指标无法准确反映模型在少数类（裂缝）上的真实性能。

针对上述难题，本研究不仅分析了多种有监督分类模型在裂缝分类任务中的性能，还评估了将自监督模型DinoV2与线性分类头相结合应用于裂缝分类任务的有效性。本研究的主要创新点如下：

1）采用自监督DinoV2框架进行特征提取，并结合线性分类头实现裂缝分类。该方法将先进的自监督学习技术应用于结构完整性评估领域，验证了其在优化裂缝检测方法方面的实用性。本文核心贡献在于证实了DinoV2在裂缝特征提取上具备优异性能。

2）在初步探索基础上，本研究进一步开展了一系列系统性实验，旨在评估有监督与自监督学习方法在不同数据集上对裂缝图像进行分类的效果与泛化能力。我们在四个不同数据集上进行了交叉测试，以验证DinoV2的泛化性能。

3）对注意力机制进行了可视化分析，对比了有监督模型与DinoV2在注意力分布上的差异，直观展示了DinoV2如何聚焦裂缝的关键特征。

结论

本研究验证了自监督模型DinoV2在多数据集裂缝分类任务中的优越性能。实验发现，尽管DinoV2能够精准识别裂缝，但其注意力机制更倾向于覆盖整张图像，而非仅聚焦于裂缝区域。这种较广的注意力范围有时会对模型输出产生干扰。与CNN等传统有监督模型在不同数据集上表现不稳定的情况相比，DinoV2凭借稳定的鲁棒性与检测精度脱颖而出。

该模型的一大显著优势在于，无需大量标注数据即可充分利用数据的内在信息，有效提升泛化能力与检测效率。基于上述研究结果，我们对DinoV2在裂缝分类领域的引领潜力持乐观态度，可为裂缝检测及更广泛领域的应用拓展奠定基础。针对该模型存在的不足，未来研究将着重优化DinoV2的特征提取机制，减少无关干扰，进一步提升检测精度。

全文下载：

Autonomous Detection of Concrete Cracks Using Self-supervised DinoV2

Taoyuan Zhu, Ali Braytee, Karthick Thiyagarajan, Xing Zi, Samir Mustapha, Xian Tao & Mukesh Prasad

https://link.springer.com/article/10.1007/s11633-025-1553-5

BibTex:

@Article{MIR-2024-07-289,

author={Taoyuan Zhu, Ali Braytee, Karthick Thiyagarajan, Xing Zi, Samir Mustapha, Xian Tao, Mukesh Prasad },

journal={Machine Intelligence Research},

title={Autonomous Detection of Concrete Cracks Using Self-supervised DinoV2},

year={2026},

volume={23},

issue={1},

pages={168-184},

doi={10.1007/s11633-025-1553-5}}

特别感谢本文第一作者、悉尼科技大学朱陶源对以上内容的审阅和修改！

发表于: 2026-04-082026-04-08 09:32:39
原文链接：https://page.om.qq.com/page/OdWmLCzRpD0GAUMi_Dn2K_LQ0
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

悉尼科技大学等团队 | 用于裂缝检测的高性能视觉特征提取自监督模型DinoV2

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐