1.Single Image Haze Removal Using Dark Channel Prior 何凯明 2009 CVPR
前一篇文章详细介绍和总结基于溯源图的APT攻击检测安全顶会内容,花了作者一个多月时间。这篇文章将讲解ACE去雾算法、暗通道先验去雾算法以及雾化生成算法,并且参考了两位计算机视觉大佬(Rizzi 何恺明)的论文。希望这篇文章对您有所帮助,这些大佬是真的值得我们去学习,献上小弟的膝盖~fighting!
然而基于监督学习类的算法需要采集样本,但是由于实际样本不容易采集需要,通过图像处理叠加雾霾,导致实际效果与真实世界雾霾有较大区别,因此这类算法效果在实验室环境下表现非常棒但是实际应用却表现不够理想。因此作者对去雾去雨类算法还是乐忠于普通图像处理算法。
编者按:本文作者蔡博仑,华南理工大学在读博士研究生。主要研究方向,机器学习,计算机视觉,图像处理等。 导读 北京城被中度污染天气包围,到处都是灰蒙蒙一片——雾霾天又来了。从11日起,雾霾天气就开始出现,根据北京环境监测中心最新预报,这一轮雾霾短期内不会明显好转,尤其是今明两天,北京空气质量维持在4级中度污染,雾霾会一直持续到本周日。 雾霾是特定气候与人类活动相互作用的结果。高密度人口的经济生产及社会活动会排放大量细颗粒物,一旦排放量超过大气循环和承载能力,悬浮颗粒受静稳天气的影响持续积聚,极易出现大范围的雾
单幅图像去雾是一个具有挑战性的不适定问题。文献中现有的去雾方法,包括最近引入的深度学习方法,将去雾问题建模为估计中间参数的问题,场景透射图和大气光。这些用于根据模糊输入图像计算无模糊图像。这种方法只关注中间参数的精确估计,而优化框架中没有考虑无霾图像的美学质量。因此,中间参数估计中的误差经常导致产生低质量的无霾图像。在本文中,我们提出了CANDY(基于条件敌对网络的模糊图像去雾),这是一个完全端到端的模型,它直接从模糊的输入图像生成一个干净的无模糊图像。CANDY还将无雾霾图像的视觉质量纳入优化函数;从而产生高质量的无雾度图像。这是文献中第一个提出用于单一图像去雾的完全端到端模型的作品之一。此外,这是第一个工作,以探索概念的生成敌对网络的问题,单一图像霾清除。CANDY在合成创建的雾霾图像数据集上进行训练,而评估是在具有挑战性的合成和真实雾霾图像数据集上进行的。CANDY的广泛评估和比较结果表明,它在定量和定性方面都明显优于文献中现有的最先进的去雾方法。
自动驾驶、视频监控、军事侦察等户外视觉系统采集到的图像/视频极易受到恶劣天气的影响,不仅主观感受差,而且会对后续的目标检测、跟踪、分类与识别等智能化分析处理任务造成严重影响。雾霾是一种常见的图像降质因素,去雾技术通过对雾霾进行去除,可以有效提升图像的主观感受。从客观角度来看,增强后的图像有助于提升后续智能化分析处理任务的性能。因此,图像去雾成为近年来工业界和学术界的研究热点[1]。
其实之前对图像去雾也没有什么深入的理解,只是了解,实现过一些传统的图像去雾方法而已。个人感觉,在CNN模型大流行的今天,已经有很多人忽略了传统算法的发展,以至于你今天去搜索10年前的传统去雾算法或许根本找不到相关资料了,或许这就是网络中的围城吧。今天周六有空来整理一下我所了解到的图像去雾技术的发展,并尝试做一个详细点的综述。
在这篇文章中,我们提出了一个端到端的网络,称为Cycle-Dehaze,为单一图像去雾问题,它配对的有雾图像和其对应的图像进行训练。也就是说,我们通过以不成对的方式加入干净和模糊的图像来训练网络。此外,所提出的方法不依赖于大气散射模型参数的估计。我们的方法通过结合循环一致性和感知损失来增强CycleGAN方法,以提高纹理信息恢复的质量,并生成视觉上更好的无雾霾图像。典型地,用于去雾的深度学习模型将低分辨率图像作为输入并产生低分辨率输出。然而,在NTIRE 2018单幅图像去雾挑战中,提供了高分辨率图像。因此,我们应用双三次降尺度。从网络获得低分辨率输出后,我们利用拉普拉斯金字塔将输出图像提升到原始分辨率。我们在NYU-Depth、, I-HAZE, and O-HAZE数据集上进行了实验。大量实验表明,该方法从定量和定性两个方面改进了CycleGAN方法。
论文地址:http://openaccess.thecvf.com/content_CVPR_2020/papers/Pang_BidNet_Binocular_Image_Dehazing_Without_Explicit_Disparity_Estimation_CVPR_2020_paper.pdf
计算机视觉的底层,图像处理,根本上讲是基于一定假设条件下的信号重建。这个重建不是3-D结构重建,是指恢复信号的原始信息,比如去噪声。这本身是一个逆问题,所以没有约束或者假设条件是无解的,比如去噪最常见的假设就是高斯噪声。
计算机视觉世界三大顶会之一的CVPR 2021论文接收结果出炉!本次大会收到来自全球共7015篇有效投稿,最终有1663篇突出重围被录取,录用率约为23.7%。本次,腾讯优图实验室共有20篇论文被收录,其中Oral论文4篇,涵盖人脸识别、对抗攻击、时序动作定位、视频动作分割、无监督人脸质量评估等前沿领域。
目标检测是计算机视觉中的一个关键技术,已经在制造业、农业、医疗保健、监控安全、交通控制和自动驾驶车辆等多个领域得到广泛应用。这是因为目标检测具有双重目的:对图像内的物体进行分类和定位。近年来,目标检测方法取得了重大进展,特别是采用深度卷积神经网络(DNN)后。这些方法显示出显著的有效性和准确性,极大地推动了相关领域的发展。
近五十年来,基于卷积神经网络的目标检测方法得到了广泛的研究,并成功地应用于许多计算机视觉应用中。然而,由于能见度低,在恶劣天气条件下检测物体仍然是一项重大挑战。在本文中,我们通过引入一种新型的双子网(DSNet)来解决雾环境下的目标检测问题。该双子网可以端到端训练并共同学习三个任务:能见度增强、目标分类和目标定位。通过包含检测子网和恢复子网两个子网,DSNet的性能得到了完全的提高。我们采用RetinaNet作为骨干网络(也称为检测子网),负责学习分类和定位目标。恢复子网通过与检测子网共享特征提取层,采用特征恢复模块增强可见性来设计。实验结果表明我们的DSNet在合成的有雾数据集上达到了50.84%的mAP,在公开的有雾自然图像数据集上达到了41.91%的精度。性能优于许多最先进的目标检测器和除雾和检测方法之间的组合模型,同时保持高速。
通知:这篇文章有15篇论文速递信息,涉及目标检测、目标跟踪、姿态估计、SLAM、GAN、行为识别、去雾、网络优化等方向 创办CVer公众号,渐渐半个多月了,很感谢得到这么多童鞋的关注和支持。特别是看到后台有人给我留言:加油,我很喜欢你的公众号。我心里很满足,也很有动力。 我尽量维持1.5day频率的更新速度,但写一篇推文确实太耗时间了,哪怕暂时是以“译文”为主的文章。在此向那些奉献知识的工作者表示致敬。 最近有同学建议我,可以开启打赏功能,分享知识的同时,获得物质上的赞赏,也是作为对你的工作一种肯定。我没有
本文提出了 DefogGAN,这是一种推断即时战略(Real-Time Strategy,RTS)游戏中战争迷雾后的隐藏信息状态的生成式方法。给定一个部分可观测的状态,DefogGAN 可以将游戏的去雾图像作为预测信息生成。这样的信息可以创造战略智能体。DefogGAN 是一种条件 GAN 的变体,它使用了金字塔重建损失,从而在多个特征分辨率尺度上进行优化。本文使用一个大型专业的星际争霸录像数据集验证了 DefogGAN。结果表明 DefogGAN 可以预测敌方建筑物和作战单位,准确率与职业玩家相当,并且比当前最佳的去雾模型的性能更好。
1、Object Detection in Fog Degraded Images
基于图像增强的技术试图生成无雾图像。然而,从有雾图像中恢复无雾图像比在雾天图像中检测物体要困难得多。另一方面,基于领域适应的方法并不使用目标领域中的标记数据集。这两类方法都在尝试解决一个更难的问题版本。 FogGuard特别设计用来补偿场景中存在的雾天条件,确保即使在雾天也能保持稳健的性能。作者采用YOLOv3作为基准目标检测算法,并引入了一种新颖的“教师-学生”感知损失,以提高雾天图像中的目标检测准确度。 在如PASCAL VOC和RTTS等常见数据集上的广泛评估中,作者展示了作者网络性能的提升。作者证明,FogGuard在RTTS数据集上达到了69.43%的mAP,而YOLOv3为57.78%。 此外,作者表明,尽管作者的训练方法增加了时间复杂度,但在推理过程中与常规的YOLO网络相比,它并没有引入任何额外的开销。
这就是麻省理工学院(MIT)计算机视觉课《Advances in Computer Vision》6.8300 在 2024 新学期的盛况。
Topaz Photo AI Mac版是一款功能强大的图像处理软件,使用人工智能技术对照片进行自动优化和增强。该软件可以自动调整曝光、对比度、色彩、细节等参数,同时还可以智能去除噪点、模糊和其他不良影响。Topaz Photo AI 支持多种图像格式,包括 RAW 格式,在处理图片时能够保留最高质量的细节和精度。
AI科技评论消息,近日,Kaggle Blog上刊登了对「Planet: Understanding the Amazon from Space」比赛冠军的专访,在访问中,我们了解到了冠军选手bestfitting的一些基础信息,他在比赛中所用的一些技术细节,以及给大家的建议。AI科技评论将采访原文编译整理如下: 在最近举办的「Planet: Understanding the Amazon from Space」比赛中,主办方Planet为了更好地追踪和了解到森林被砍伐的原因,想要让Kaggle上的参
近日,Kaggle Blog上刊登了对「Planet: Understanding the Amazon from Space」比赛冠军的专访,在访问中,我们了解到了冠军选手bestfitting的一些基础信息,他在比赛中所用的一些技术细节,以及给大家的建议。 AI研习社将采访原文编译整理如下: 在最近举办的「Planet: Understanding the Amazon fromSpace」比赛中,主办方Planet为了更好地追踪和了解到森林被砍伐的原因,想要让Kaggle上的参赛选手为亚马逊盆地中的卫
尽管基于深度学习的目标检测方法在传统数据集上取得了可喜的结果,但从恶劣天气条件下捕获的低质量图像中定位目标仍然具有挑战性。现有方法要么难以平衡图像增强和目标检测的任务,要么经常忽略对检测有益的潜在信息。
你是否厌倦了最新的Transformer/MLP模型的「不灵活性」和「高空间复杂度」?
在有雾的情况下,能见度下降,造成许多问题。由于大雾天气,能见度降低会增加交通事故的风险。在这种情况下,对附近目标的检测和识别以及对碰撞距离的预测是非常重要的。有必要在有雾的情况下设计一个目标检测机制。针对这一问题,本文提出了一种VESY(Visibility Enhancement Saliency YOLO)传感器,该传感器将雾天图像帧的显著性映射与目标检测算法YOLO (You Only Look Once)的输出融合在一起。利用立体相机中的图像传感器对图像进行检测,利用雾传感器激活图像传感器,生成深度图来计算碰撞距离。采用去雾算法对基于区域协方差矩阵的显著性图像帧进行质量改进。在改进后的图像上实现了YOLO算法。提出的融合算法给出了Saliency Map和YOLO算法检测到的目标并集的边界框,为实时应用提供了一种可行的解决方案。
目标检测任务的目标是找到图像中的所有感兴趣区域,并确定这些区域的位置和类别。由于目标具有许多不同的外观、形状和姿态,再加上光线、遮挡和成像过程中其它因素的干扰,目标检测一直以来都是计算机视觉领域中一大挑战性难题。
Pytorch模块用来模型训练和网络层建立;其底层和Torch框架一样,但是使用Python重新写了很多内容,不仅更加灵活,支持动态图,而且提供了Python接口。不仅能够实现强大的GPU加速,同时还支持动态神经网络。
感谢大家关注FFmpeg在OnVideo以及AI方面的一些工作,我是刘歧,是OnVideo联合创始人的同时也担任技术负责人,同时也是FFmpeg的官方顾问,FFmpeg GSoC 2019 Mentor,FFmpeg决策委员会的委员,以及腾讯云TVP。我主要的兴趣在嵌入式开发、图形图像及音视频流媒体处理、分布式系统设计等领域。FFmpeg官方有我的联系方式,大家有问题可以和我随时交流。关于FFmpeg深度学习场景下的应用,目前看来,颇具价值且实用。
AI 科技评论按:CVPR 2018 将在美国盐湖城举行。腾讯优图实验室继在 ICCV 有 12 篇论文被收录(含 3 篇口头报告)后,在今年的 CVPR 2018 上有多篇论文被录用,也凭借这一点在雷锋网学术频道 AI 科技评论旗下数据库项目「AI 影响因子」中有相应展示。
源代码:https://github.com/wenyyu/ImageAdaptive-YOLO
未来科学大奖设立于 2016 年,关注原创性的基础科学研究。目前设置了「生命科学奖」、「物质科学奖」和「数学与计算机科学奖」三大奖项,单项奖金 725 万元人民币(等值 100 万美元)。
机器之心报道 编辑:陈萍、小舟 在卷积神经网络和 ViT 竞争计算机视觉领域霸主时,谷歌:我取二者所长,提出一种两全其美的方法。 自从 2012 年 AlexNet 问世以来,卷积神经网络一直是计算机视觉的主要机器学习架构。最近,受自然语言处理启发,注意力机制已逐渐纳入视觉模型。这些注意力方法增强了输入数据的某些部分,同时最小化了其他部分,以便网络可以专注于数据最重要的部分。 视觉 Transformer (ViT) 为计算机视觉模型设计创造了一个完全没有卷积的全新领域。ViT 将多个图像 patch 视为
新智元报道 来源:腾讯优图 编辑:江磊、克雷格 【新智元导读】即将在6月美国盐湖城举行的计算机视觉顶级会议CVPR 2018,腾讯优图的其中两篇入选论文,由于其较高的应用价值,受到学术界和产业界的
「作为一位 FAIR 研究科学家,我将于 2024 年加入麻省理工学院(MIT)电气工程与计算机科学系 EECS 担任教职。」
2016 年,《财富》杂志在文章《Why deep learning is suddenly changing your life》曾如此描述这波 AI 浪潮的兴起,「最初的革命火花开始于 2009 年。那年夏天微软的邓力邀请神经网络先驱、多伦多大学的 Geoffrey Hinton 来参观并合作... 邓力的团队用神经网络做了大量语言识别方面的实验。」
作者 | 王玥 编辑 | 陈彩娴 新奥尔良当地时间6月21日上午8:30,计算机视觉领域公认三大顶级会议之一CVPR 2022开幕。 CVPR开幕式伊始,由大会主席Jiri Matas致辞,并介绍了本次大会的4位主席及5位程序主席。 值得一提的是,本次大会有两位华人主席,分别是主席权龙(Long Quan,上排右二)与程序主席华刚(Gang Hua,下排左二)。 接下来主席Jiri Matas介绍了CVPR 2022的投稿情况: 本届CVPR一共收到8161份论文投稿,接受论文2064份,截止2022年
📷 来源:量子位 本文共8300字,建议阅读10分钟。 本文从立题背景、作者思路及研究特点为你详解计算机视觉顶会论文。 一年一度的计算机视觉顶会CVPR即将召开,入选论文也陆续揭晓。 今天分享入选论文解析的是腾讯AI Lab。 在去年6篇入选之后,腾讯AI Lab今年状态更勇,总共有21篇论文入选CVPR。 以下是21篇入选论文详解: 1. 面向视频理解的端到端动作表示学习 End-to-End Learning of Motion Representation for V
End-to-End Learning of Motion Representation for Video Understanding
每周一期,纵览音视频技术领域的干货。 新闻投稿:contribute@livevideostack.com。 13款用于Web的流行HTML5视频播放器 当视频流媒体席卷通信世界,为了保持和提升用户增长,内容创造者和流媒体服务提供者需要在自己的网站上内嵌HTML5视频播放器。在本文中,我们将来了解一下现在市面上可用的HTML5视频播放器。 Severe Tire Damage:世界上第一个在互联网上直播的摇滚乐队 1993年6月24日,Severe Tire Damage在互联网上进行了一场直播表演(
大家好,这是专栏《计算摄影》的第四篇文章,这一个专栏来自于计算机科学与摄影艺术的交叉学科。今天我们讨论的问题是如何学会做图像增强。
AI 科技评论按:CVPR 2018 日前已公布录用名单,腾讯 AI Lab 共有 21 篇论文入选。本文转载于「腾讯 AI 实验室」, AI 科技评论经授权转载。 近十年来在国际计算机视觉领域最具影响力、研究内容最全面的顶级学术会议 CVPR,近日揭晓 2018 年收录论文名单,腾讯 AI Lab 共有 21 篇论文入选,位居国内企业前列,我们将在下文进行详解,欢迎交流与讨论。 去年 CVPR 的论文录取率为 29%,腾讯 AI Lab 共有 6 篇论文入选。2017 年,腾讯 AI Lab 共有 100
点击 机器学习算法与Python学习 ,选择加星标 精彩内容不迷路 量子位 | 公众号 QbitAI 旷视首席科学家、旷视研究院院长孙剑博士,今日凌晨因病不幸离世。 孙剑博士1976年10月出生,今年45岁。他曾任微软亚研院首席研究员,此前两次获CVPR最佳论文奖。 他最为人所熟知的成就,是带领何恺明等人做出的残差网络ResNet。ResNet在2015年提出之后,拿下过ImageNet冠军,并斩获了CVPR 2016最佳论文奖。 孙剑的博士研究生专业是模式识别与智能控制专业,作为微软亚洲研究院和西安交
你是否厌倦了最新的Transformer/MLP模型"不灵活性"和"高空间复杂度"?
腾讯AI Lab共有21篇论文入选,位居国内企业前列,我们将在下文进行详解,欢迎交流与讨论。
📷 来源 | 腾讯AI实验室(tencent_ailab) 近十年来在国际计算机视觉领域最具影响力、研究内容最全面的顶级学术会议CVPR,近日揭晓2018年收录论文名单,腾讯AI Lab共有21篇论文入选。 ▌计算机视觉未来方向与挑战 计算机视觉(Computer Vision)的未来,就是多媒体AI崛起,机器之眼被慢慢打开的未来。多媒体有的时候又称为富媒体,是对图像、语音、动画和交互信息的统称。多媒体AI就是对这些所有内容的智能处理。 一份国际报告显示,到2021年,视频将占全球个人
关注并星标 从此不迷路 计算机视觉研究院 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 论文获取|回复“IAYOLO”获取paper 源代码:https://github.com/wenyyu/ImageAdaptive-YOLO 计算机视觉研究院专栏 作者:Edison_G 最近开车发现雾天和晚上视线不是很清楚,让我联想到计算机视觉领域,是不是也是因为这种环境情况,导致最终的模型检测效果不好。最近正好看了一篇文章,说恶劣天气下的目标检测,接下来我们一起深入了解下。
Towards Compact Single Image Super-Resolution via Contrastive Self-distillation 利用对比自蒸馏实现超分加速 (IJCAI 2021)原创论文解读,首发于GiantPandaCV公众号,禁止其他任何形式的转载!
许多图像处理算法虽在单个图像处理中表现出色,但将其直接用于视频时往往会遇到时域不一致问题。本文提出一种通用的框架,可将图像处理算法转换为对应的具有高度时域一致性的视频处理算法,以解决上述问题。
领取专属 10元无门槛券
手把手带您无忧上云