实时多人姿态估计一直是计算机视觉领域的“性能炼金术”:要在精度、速度、部署成本之间找到最优解,并不容易。而由上海人工智能实验室提出的 RTMPose 正式打破这...
2025 年,目标检测依然是计算机视觉中最实用的任务之一。从自动驾驶、工业质检到医疗成像、安全安防,目标检测是很多 AI 应用系统的“感知核心”。
本研究旨在解决超声(US) 用于肾脏体积测量时面临的操作复杂(学习曲线陡)和需要频繁在患者与屏幕间切换视线(效率低、易疲劳)的难题。为此,我们提出了一套整合方案...
目标检测与追踪技术是计算机视觉领域最热门的应用之一,广泛应用于自动驾驶、交通监控、安全防护等场景。今天我们将带你一步步实现一个完整的项目,使用YOLOv8 + ...
今天我想和你聊聊刚刚发布不久的 YOLOv13 模型——不是那种堆参数、列数据的纯技术长文,而是一篇使用者视角的评价和建议。
为什么 AI 模型会做出这样的判断?这是每一个使用深度神经网络的人都曾疑惑过的问题。尽管 CNN(卷积神经网络)在图像识别中表现卓越,但“黑盒”特性让人难以信服...
为提升自动驾驶车辆在复杂环境下的感知可靠性,本文提出融合深度学习与多模态大语言模型(MLLM)的综合方案。研究评估了ResNet-50、YOLOv8、RT-DE...
自2020年DETR提出以来,基于Transformer的目标检测模型成为学界研究热点。虽然 DETR 展示了新范式的巨大潜力,但也暴露出诸如收敛慢、匹配机制不...
本文提出了一种利用YOLOv5模型进行航拍图像目标检测的稳健方法。我们专注于识别关键目标,包括救护车、车祸现场、警车、拖车、消防车、侧翻车辆及着火车辆。通过采用...
国际计算机视觉大会(ICCV)是由电气和电子工程师协会(IEEE)主办的学术会议,每两年举办一次。它与 CVPR 和 ECCV 并称为计算机视觉领域的三大顶级会...
YOLO 系列从 v1 一路进化到 v13,始终在追求更快、更准、更轻的目标检测模型。而刚刚发布的 YOLOv13,不仅性能全系领先,还带来了“超图”这个硬核概...
在人工智能蓬勃发展的今天,计算机视觉技术正以前所未有的速度改变着我们的世界。从手机解锁到疾病诊断,从自动驾驶到艺术创作,机器“看懂”图像的能力至关重要。卷积神经...
本文汇总了多篇围绕YOLOv12这一实时目标检测前沿模型的最新研究论文。内容涵盖其核心架构创新(如高效注意力机制、轻量化设计),在特定场景(水下探测、果园绿色水...
关键词:Pupil Labs、眼动追踪、Neon、Pupil Core、计算机视觉、科研工具、人机交互
在智慧交通的演进中,算法的实战能力需通过极端天气、高动态目标、微观标识识别的严苛场景验证。TuSimple、CULane、UA-DETRAC、CCPD四大支柱数...
本文分析 YOLO11 在车辆检测上的性能。相比前代(YOLOv8/v10),YOLO11 通过架构改进提升了速度、精度和在复杂环境(小目标、遮挡)下的鲁棒性。...
在无人机视觉领域,算法的鲁棒性需在动态视角、尺度变化、复杂背景的严苛环境下验证。UAVDT 与 VisDrone 作为全球公认的无人机视角双雄,以其大规模、多维...
2025年计算机视觉与模式识别领域的顶级盛会CVPR刚刚落下帷幕!这场汇聚全球顶尖AI大脑的盛会,再次用无数令人瞠目结舌的突破宣告:我们眼前的世界,正被算法以超...
随着眼动追踪在科研、UX 测试、AR/VR 交互等领域的广泛应用,越来越多的用户开始使用 Pupil Core 平台。在使用过程中,经常会遇到硬件连接、校准失败...
6月6日-8日,第十五届视觉与学习青年学者研讨会 (VALSE 2025)在广东珠海国际会展中心盛大开幕。本届大会由中国图象图形学学会联合主办,中山大学承办,聚...