在目标检测的应用领域,水下目标检测目前仍然还是一个具有挑战的领域,本文总结了水下目标检测的关键问题、相关论文以及一些比赛的开源方案,希望对大家有帮助。
水下目标检测旨在对水下场景中的物体进行定位和识别。这项研究由于在海洋学、水下导航等领域的广泛应用而引起了持续的关注。但是,由于复杂的水下环境和光照条件,这仍然是一项艰巨的任务。因此近年来有多个赛事与水下目标检测相关,接下来我们将介绍在水下目标检测领域的深度学习方法概述。
为了应对这些挑战,作者引入了EnYOLO,这是一个集成的实时框架,旨在同时进行具有领域自适应能力的UIE和UOD。 具体来说,UIE和UOD任务头共享相同的网络主干,并采用轻量级设计。此外,为了确保两个任务的平衡训练,作者提出了一种多阶段训练策略,旨在持续提升它们的性能。 另外,作者提出了一种新颖的领域自适应策略,用于对来自不同水下环境的特征嵌入进行对齐。全面实验表明,作者的框架不仅在UIE和UOD任务上达到了最先进(SOTA)的性能,而且在应用于不同的水下场景时也显示出卓越的适应性。作者的效率分析进一步突显了框架在船上部署的巨大潜力。
论文地址:https://arxiv.org/abs/2005.11552.pdf
下面要介绍的论文发于2019年12月,题为「ROIMIX: PROPOSAL-FUSION AMONG MULTIPLE IMAGESFOR UNDERWATER OBJECT DETECTION」。
当下,由于水下恶劣危险的环境,海洋产业在发展中面临着迫切的产业智能化升级需求。为了解决该类问题,将光学技术、声学技术和 AI 算法更好的融入到海洋产业中,近期,一场由国家自然基金委、鹏城实验室和湛江市人民政府联合主办的线上比赛「水下目标检测算法赛」拉开了帷幕。
在过去的几十年里,探索海洋环境的兴趣日益增长,这导致了水下活动范围的扩大,如基础设施开发[1]和考古探索[2]。由于水下条件的不可预测和通常是未知的特点,自主水下航行器(AUVs)在执行从调查到维护等各种任务中变得至关重要。AUVs能够根据预定义计划进行数据收集和执行水下操作。
据最新消息,受暴雨影响,河北地铁全线网车站停运,纯电公交停运,机场取消、延误航班超200架次,途径的多个高速路段全线禁止所有车辆上站。在人工智能时代,我们需要通过AI来检测洪水或泳池内溺水的人,及时做到拯救工作。
水下目标检测技术已引起了人们的广泛关注。 然而,由于几个挑战,这仍然是一个未解决的问题。 我们通过应对以下挑战,使之更加现实。 首先,目前可用的数据集基本上缺乏测试集注释,导致研究者必须在自分测试集(来自训练集)上与其他sota进行比较。 训练其他方法会增加工作量,不同的研究人员划分不同的数据集,导致没有统一的基准来比较不同算法的性能。 其次,这些数据集也存在其他缺点,如相似图像过多或标签不完整。 针对这些挑战,我们在对所有相关数据集进行收集和重新标注的基础上,引入了一个数据集——水下目标检测(detection Underwater Objects, DUO)和相应的基准。 DUO包含了多种多样的水下图像,并有更合理的注释。 相应的基准为学术研究和工业应用提供了SOTAs(在mmddetection框架下)的效率和准确性指标,其中JETSON AGX XAVIER用于评估检测器速度,以模拟机器人嵌入式环境。
在去年,陆陆续续和队友@willer共同参加了一些计算机视觉竞赛(图像检测、分类竞赛),取得了一些不错的成绩。在年底,偶然得知Kaggle上有一个热度很高的还行检测的比赛,于是简单参考了一下。今天榜单揭晓,非常幸运,在比赛切换到了私榜后,分数大幅度提升,从初赛Public Leaderboard的1100多名直接上分到了Top10,很幸运的荣获了人生中的第一个Kaggle Gold。
来源:专知本文为论文介绍,建议阅读5分钟本文为促进舰船目标检测技术的应用提供了新的思路。 舰船目标检测是海域监控、港口流量统计、舰船身份识别以及行为分析与取证等智能海事应用的基石。随着我国海洋强国建设的推进,智慧航运和智慧海洋工程迅速发展,对通过海事监控视频开展有效的舰船目标检测识别以确保航运和海洋工程安全的需求日益紧迫。本文针对基于海事监控视频的舰船目标检测任务,回顾了舰船目标检测数据集及性能评价指标、基于传统机器学习和基于卷积神经网络的深度学习的目标检测方法等方面的国内外研究现状,分析了海洋环境中舰船
有挺长时间没有更新论文速递了,这段时间的论文很多,但比较亮眼的论文并也不多。为了方便大家阅读,我已经将其中的目标检测(Object Detection)论文整理出来。
YOLO目标检测算法诞生于2015年6月,从出生的那一天起就是“高精度、高效率、高实用性”目标检测算法的代名词。
Transformer在计算机视觉领域迅速普及,特别是在目标识别和检测领域。在检查最先进的目标检测方法的结果时,我们注意到,在几乎每个视频或图像数据集中,transformer始终优于完善的基于cnn的检测器。虽然基于transformer的方法仍然处于小目标检测(SOD)技术的前沿,但本文旨在探索如此广泛的网络所提供的性能效益,并确定其SOD优势的潜在原因。小目标由于其低可见性,已被确定为检测框架中最具挑战性的目标类型之一。论文的目的是研究可以提高transformer在SOD中的性能的潜在策略。本调查对跨越2020年至2023年的60多个针对SOD任务开发的transformer的研究进行了分类。这些研究包括各种检测应用,包括在通用图像、航空图像、医学图像、主动毫米图像、水下图像和视频中的小目标检测。论文还编制并提供了12个适合SOD的大规模数据集,这些数据集在以前的研究中被忽视了,并使用流行的指标如平均平均精度(mAP)、每秒帧(FPS)、参数数量等来比较回顾研究的性能。
作者:Nikita Kitaev / Lukasz Kaiser / Anselm Levskaya
在科学研究中,从方法论上来讲,都应“先见森林,再见树木”。当前,人工智能学术研究方兴未艾,技术迅猛发展,可谓万木争荣,日新月异。对于AI从业者来说,在广袤的知识森林中,系统梳理脉络,才能更好地把握趋势。为此,我们精选国内外优秀的综述文章,开辟“综述专栏”,敬请关注。
本文整理了收录于 ICCV 2023 会议的数据集论文,涵盖了水下图像视频、阴影去除、目标检测、跟踪分割、交互、超分辨率等领域。
本文收集整理了多个小目标检测、图像识别、图像分类等方向的开源数据集,本次还有猫咪、斯坦福狗狗数据集以及3D MNIST数字识别等~
论文地址:https://arxiv.org/pdf/1912.02424.pdf
每周一期,纵览音视频技术领域的干货。 新闻投稿:contribute@livevideostack.com。 ---- 9折最后一天,不要错过!LiveVideoStackCon 2022 北京站 LiveVideoStackCon 2022 音视频技术大会 北京站即将在11月4日至5日召开,本次大会将延续「音视频+无限可能」的主题,除了保证传统专题《视频编解码的新突破》、《媒体服务质量保障与QoE》、《声声入耳:音频新体验》等内容质量过关以外,我们加强探索音视频技术对不同行业、场景、业务的赋能能力。从
一个包含 37 个类别的宠物数据集,每个类别大约有 200 张图像。这些图像在比例、姿势和照明方面有很大的变化。所有图像都有相关的品种、头部 ROI 和像素级三元图分割的地面实况注释。
---- 新智元报道 编辑:桃子 好困 【新智元导读】Meta的SAM「分割一切」模型刚发布,国内团队就进行了二创,打造了一个最强的零样本视觉应用Grounded-SAM,不仅能分割一切,还能检测一切,生成一切。 Meta的「分割一切」模型横空出世后,已经让圈内人惊呼CV不存在了。 就在SAM发布后一天,国内团队在此基础上搞出了一个进化版本「Grounded-SAM」。 注:项目的logo是团队用Midjourney花了一个小时做的 Grounded-SAM把SAM和BLIP、Stable Di
每周一期,纵览音视频技术领域的干货。 新闻投稿:contribute@livevideostack.com。 什么是体积视频? 本文介绍了体积视频(Volumetric Video)的解释,创建体积视频所需的设备,并给出了具体的用例。 原创干货 | 入门或者转行音视频,应该要怎么做? 想从事(入门或者转行)音视频开发,要怎么做?很多人对此都有疑惑,不光有工作多年的职场老司机,也有求学期间的研究生同学们,本文帮你分析到底要不要从事音视频开发工作,以及如果从事音视频开发要怎么做? 虎牙直播在AI实时剪辑技术上
很多粉丝在公众号后台留言,不知如何入门3D视觉、3D领域的主线是什么,一些难点该如何解决,有哪些方法,导师新开的3D视觉方向无人指导等等。这些痛点,工坊的许多童鞋都踩过坑,也为大家提出了许多非常有价值的问题和解决思路,涵盖了计算机视觉与深度学习、点云处理、SLAM、三维重建、结构光、双目视觉、深度估计、3D检测、自动驾驶、多传感器融合等多个方向,超详细的问题和资料汇总请移步至【3D视觉从入门到精通知识星球】,一个有点干货的学习社区!
转载自丨3d tof 原文地址:在OpenCV中基于深度学习的边缘检测 推荐阅读:普通段位玩家的CV算法岗上岸之路(2023届秋招)
本文报告介绍了水下仿生机器人的设计,从作业臂系统、运动控制、环境自主感知与导航和三个方面介绍了目前的研究现状,同时带来了研究团队在这些关键问题上的最新研究成果,最后介绍整个水下抓取自主作业控制流程。
亚马逊正在许多应用领域中推进机器人技术。Amazon Robotics设计,编码,构建和制造改变游戏规则的软件应用程序,控制系统,机器人技术和相关硬件,这正在改变Amazon在全球范围内的运营方式。AWS RoboMaker为机器人开发人员提供最完整的云解决方案,以大规模模拟,测试和安全部署机器人应用程序。
涉水光学(Water-related Optics)主要研究光与水的物质相互作用机理及光的跨介质传播机理,解决与涉水光学数据智能获取,信息传输及智能信号处理有关的各种问题,探索光学在涉水领域中应用的科学,是临地安防(Vicinagearth Security, VS)体系中水下安防的重要学科支撑。
水下机器人系统复杂,通讯和定位系统依旧是最大难题。 “当时国内还没有人关注水下机器人这个市场,水下机器人公司基本不存在。有所涉及的也都是代理公司,将国外的产品卖给国内有需求的群体。”对于2012、2013年的水下机器人市场,深之蓝创始人兼CEO魏建仓这样表示。 如今,2018年已经过去了三个月,而水下机器人市场正愈加受到关注,国内从事水下机器人的企业也是越来越多。 瞄准市场机遇 打造小型化、智能化水下平台 在创业之初,深之蓝对于自己的定位就是“一个全系列的小型化、智能化水下运动平台”。 魏建仓解释,“小型
水面和水下机器人将使人们可以以更多的创新方式去探索海洋世界,成本低廉而高效,还可以减少航海作业的风险。海洋机器人正朝着其终极目标,全自主化,快速航行。新一代系统能够在现场独立运作,并无需人为参与自主决策。 全自主化的无人海洋机器人是一个重要的趋势,但是该技术在不同平台的实用性也各有不同,位于美国弗吉尼亚州Arlington的国际无人驾驶系统协会(AUVSI)海事咨询委员会(MAC)主席Heather James表示。 James相信自治时代已经开启,水下无人探测器将引领这一趋势。"自主水下机器人(AUV)将
每周一期,纵览音视频技术领域的干货。 新闻投稿:contribute@livevideostack.com。 QoS和QoE初学者指南 本篇文章从宏观角度向大家介绍QoS和QoE。我会先从它们的定义开始,然后讨论它们之间的关联。接着,我们再来简单了解公司如何衡量和使用QoS和QoE。 视频修复:无监督流对齐的序列对序列学习方法S2SVR(ICML 2022) 本文将 Seq2Seq 的架构引入到了视频超分中,其次针对光流不准的问题,之前的文章选择使用DCN进行替代,本篇论文『Unsupervised F
寒冷的冬天,大家一定很怀念炎炎夏日在海边玩水。 相信对于很多喜欢游水的朋友来说,水下的世界可比天上精彩多了呢,我们都见过空中飞行无所不能的航拍利器,可是如何在深不可测的海底拍摄呢? 总部位于法国马赛的
来看看这条可可爱爱的小鱼,七只这样的小鱼在哈佛大学实验室的一个暗淡的水箱中轻轻游动,用它们的大眼睛互相张望。
智能领域的数据主体依然是视觉、听觉、文字等模态。其中,视觉是核心赛道,也是目前智能应用的主战场。当前,视觉研究主要关注于空气和真空中,而占地表面积、天气现象甚至生命组织很大比例的各类水体中的视觉却未成体系。
夏天到了,也到了游泳的季节,为了避免后院以及公共泳池出现溺水事故,房主和泳池运营商考虑使用人工智能技术来提供额外的安全保护。
计算机视觉中的目标检测,因其在真实世界的大量应用需求,比如自动驾驶、视频监控、机器人视觉等,而被研究学者广泛关注。
作者: Adrian Rosebrock 机器之心编译 目标检测技术作为计算机视觉的重要方向,被广泛应用于自动驾驶汽车、智能摄像头、人脸识别及大量有价值的应用上。这些系统除了可以对图像中的每个目标进行识别、分类以外,它们还可以通过在该目标周围绘制适当大小的边界框来对其进行定位。本文作者从图像识别与目标检测的区别开始,进一步简单介绍了目标检测的基本模块与实现方法。本文是目标检测的一般指南,它并没有详细介绍主流的目标检测算法,这些算法读者可参考从 RCNN 到 SSD,这应该是最全的一份目标检测算法盘点
雷锋网 AI 科技评论按:2018 年 6 月 29 日至 7 月 1 日全球人工智能与机器人峰会(CCF-GAIR)在深圳召开,峰会由中国计算机学会(CCF)主办,雷锋网 (公众号:雷锋网)、香港中文大学(深圳)承办,得到了宝安市政府的大力指导,是国内人工智能和机器人学术界、工业界及投资界三大领域的顶级交流盛会,旨在打造国内人工智能领域最具实力的跨界交流合作平台。
目标检测系列: 目标检测(object detection)系列(一) R-CNN:CNN目标检测的开山之作 目标检测(object detection)系列(二) SPP-Net:让卷积计算可以共享 目标检测(object detection)系列(三) Fast R-CNN:end-to-end的愉快训练 目标检测(object detection)系列(四) Faster R-CNN:有RPN的Fast R-CNN 目标检测(object detection)系列(五) YOLO:目标检测的另一种打开方式 目标检测(object detection)系列(六) SSD:兼顾效率和准确性 目标检测(object detection)系列(七) R-FCN:位置敏感的Faster R-CNN 目标检测(object detection)系列(八) YOLOv2:更好,更快,更强 目标检测(object detection)系列(九) YOLOv3:取百家所长成一家之言 目标检测(object detection)系列(十) FPN:用特征金字塔引入多尺度 目标检测(object detection)系列(十一) RetinaNet:one-stage检测器巅峰之作 目标检测(object detection)系列(十二) CornerNet:anchor free的开端 目标检测(object detection)系列(十三) CenterNet:no Anchor,no NMS 目标检测(object detection)系列(十四)FCOS:用图像分割处理目标检测
六、图像恢复-超分 20、Fourier Space Losses for Efficient Perceptual Image Super-Resolution 许多超分辨率 (SR) 模型仅针对精度效果进行优化,模型庞大、缺乏效率。大模型在实际应用中通常不实用,本文提出新的损失函数,以从更有效的模型中实现具有高感知质量的 SR。 利用傅立叶空间监督损失来改进从丢失的高频 (HF) 内容,并设计直接在傅立叶域的判别器架构以更好地匹配目标 HF 分布。与最先进的感知 SR 方法 RankSRGAN 和 SR
在数字仿真技术应用领域,特别是在自动驾驶技术的发展中,目标检测是至关重要的一环,它涉及到对周围环境中物体的感知,为智能装备的决策和规划提供了关键信息。
编译 | 庞佳 责编 | Leo 出品 | 人工智能头条(公众号ID:AI_Thinker) 【AI 科技大本营按】本文编译自 Adrian Rosebrock 发表在 PyImageSearch 上的一篇博文。该博文缘起于一位网友向原作者请教的两个关于目标检测的问题: 如何过滤或忽略我不感兴趣的类? 如何在目标检测模型中添加新的类?这是否可行? Adrian Rosebrock 认为这两个问题是学习目标检测的同学经常问到的问题,于是创作了本篇文章统一回答。 以下为博文摘录,AI 科技大本营编译: 具体来
AI 科技大本营按:本文编译自 Adrian Rosebrock 发表在 PyImageSearch 上的一篇博文。该博文缘起于一位网友向原作者请教的两个关于目标检测的问题:
大数据文摘作品 作者:Mickey 潜艇的核心价值在于其在战争中的隐藏能力。在核战争中,核威慑可能可以摧毁一切武器,但潜艇的隐藏能力让其有可能幸存,并对敌方进行核回击。这也被军事领域成为二次打击能力,或者核报复能力。 理论上来说,从核威慑角度看,二次打击能力愈强,两国发生核战的几率也愈小,反而能达成更为稳定的核均衡关系。因此确保潜艇在核战争中的第一次导弹袭击中幸存下来,并在第二次袭击中发射导弹回应,是大国之间威慑战略的关键。 也正因如此,任何破坏潜艇隐藏能力的技术,都可能成为破坏世界的和平的“蝴蝶的翅膀”。
人类可以在几毫秒内在我们的视线中挑选出物体。事实上,你现在就环顾四周,你将观察到周围环境并快速检测到存在的物体,并且把目光回到我们这篇文章来。大概需要多长时间?
作为视觉注意力机制在目标分割任务上的延拓,并作为计算机视觉任务中非常重要的预处理步骤之一,显著性目标检测在立体匹配、图像理解、动作识别、视频检测和分割、语义分割、医学图像分割、目标跟踪、行人重识别、伪装目标检测以及图像检索等领域中发挥着非常重要的作用,如图1所示。由此可见,显著性目标检测有着广泛的应用价值和重要的研究意义。
摘要:将视觉SLAM(同步定位与地图创建)方法应用于水下环境时,扬起的沉积物会导致SLAM特征点提取与追踪困难,而且人工光源的光照不均匀还会引起特征点分布不均与数量较少。针对这些问题,设计了一种水下图像半均值滤波除尘与光照均衡化特征增强算法;根据水中杂质的像素特征,按照“检测-滤波”的顺序采取从外至内的半均值滤波过程消除扬起的沉积物在图像内造成的干扰;同时,通过统计光照均匀、充足区域内的像素分布,得到同一地形下不同位置处的环境特征相似的规律,并将其用于求解水下光照模型,将图像还原为光照均衡的状态,以此来增强图像的特征,进而实现更多有效特征点的提取。最后,利用该滤波与增强算法对多种海底地形数据集进行处理,并在ORB-SLAM3算法下测试运行。结果表明,滤波与增强后的数据集能够将特征点提取数量和构建地图的点云数量平均提高200%。综上,图像滤波除尘与特征增强算法能够有效提高视觉SLAM算法的运行效果与稳定性。
基于深度学习的目标检测方法根据有无区域提案阶段划分为区域提案检测模型和单阶段检测模型,其最近发展历程在图1中画出。
领取专属 10元无门槛券
手把手带您无忧上云