暂无搜索历史
2025年已过半,AI领域依旧风起云涌。就在大家还在研究多模态和大模型融合时,YOLOv13 的发布再次把目标检测领域推上热搜,但目标检测,这个曾经被视为CV领...
本研究旨在解决超声(US) 用于肾脏体积测量时面临的操作复杂(学习曲线陡)和需要频繁在患者与屏幕间切换视线(效率低、易疲劳)的难题。为此,我们提出了一套整合方案...
目标检测与追踪技术是计算机视觉领域最热门的应用之一,广泛应用于自动驾驶、交通监控、安全防护等场景。今天我们将带你一步步实现一个完整的项目,使用YOLOv8 + ...
今天我想和你聊聊刚刚发布不久的 YOLOv13 模型——不是那种堆参数、列数据的纯技术长文,而是一篇使用者视角的评价和建议。
为什么 AI 模型会做出这样的判断?这是每一个使用深度神经网络的人都曾疑惑过的问题。尽管 CNN(卷积神经网络)在图像识别中表现卓越,但“黑盒”特性让人难以信服...
为提升自动驾驶车辆在复杂环境下的感知可靠性,本文提出融合深度学习与多模态大语言模型(MLLM)的综合方案。研究评估了ResNet-50、YOLOv8、RT-DE...
自2020年DETR提出以来,基于Transformer的目标检测模型成为学界研究热点。虽然 DETR 展示了新范式的巨大潜力,但也暴露出诸如收敛慢、匹配机制不...
本文提出了一种利用YOLOv5模型进行航拍图像目标检测的稳健方法。我们专注于识别关键目标,包括救护车、车祸现场、警车、拖车、消防车、侧翻车辆及着火车辆。通过采用...
YOLO 系列从 v1 一路进化到 v13,始终在追求更快、更准、更轻的目标检测模型。而刚刚发布的 YOLOv13,不仅性能全系领先,还带来了“超图”这个硬核概...
在人工智能蓬勃发展的今天,计算机视觉技术正以前所未有的速度改变着我们的世界。从手机解锁到疾病诊断,从自动驾驶到艺术创作,机器“看懂”图像的能力至关重要。卷积神经...
本文汇总了多篇围绕YOLOv12这一实时目标检测前沿模型的最新研究论文。内容涵盖其核心架构创新(如高效注意力机制、轻量化设计),在特定场景(水下探测、果园绿色水...
在智慧交通的演进中,算法的实战能力需通过极端天气、高动态目标、微观标识识别的严苛场景验证。TuSimple、CULane、UA-DETRAC、CCPD四大支柱数...
本文分析 YOLO11 在车辆检测上的性能。相比前代(YOLOv8/v10),YOLO11 通过架构改进提升了速度、精度和在复杂环境(小目标、遮挡)下的鲁棒性。...
在无人机视觉领域,算法的鲁棒性需在动态视角、尺度变化、复杂背景的严苛环境下验证。UAVDT 与 VisDrone 作为全球公认的无人机视角双雄,以其大规模、多维...
2025年计算机视觉与模式识别领域的顶级盛会CVPR刚刚落下帷幕!这场汇聚全球顶尖AI大脑的盛会,再次用无数令人瞠目结舌的突破宣告:我们眼前的世界,正被算法以超...
90%的YOLO模型性能问题源于数据准备不当!当你的检测模型在真实场景中漏检、误检或泛化失败时,问题可能不在算法本身,而是隐藏在数据预处理和增强的细节中。本文将...
本文介绍了复旦联合腾讯优图发布高精度多模态数据集Real-IAD D³,并基于此数据集提出了一种创新的多模态融合检测方法,数据集已被CVPR 2025收录,并开...
构建高效、智能、安全的现代电网,离不开人工智能视觉技术的深度赋能。无论是自动识别配电房仪表读数、精准检测输电线路上的致命异物,还是实时监控设备绝缘状态、评估潜在...
针对云南电网输电线路异物检测中小目标、强遮挡、多尺度和复杂背景的难题,本研究对YOLOv8m模型进行三重改进:引入GAM注意力机制强化遮挡目标识别,用SPPCS...
何恺明团队最新研究出手,给火爆的扩散模型加了个「收纳整理」功能!无需修改模型结构、不增参数、不靠外部数据,仅需一个即插即用的正则化项——Dispersive L...
暂未填写公司和职称
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址