首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

A full data augmentation pipeline for small object detection based on GAN

小物体(即32×32像素以下的物体)的物体检测精度落后于大物体。为了解决这个问题,我们设计了创新的体系结构,并发布了新的数据集。尽管如此,许多数据集中的小目标数量不足以进行训练。生成对抗性网络(GAN)的出现为训练体系结构开辟了一种新的数据增强可能性,而无需为小目标注释巨大数据集这一昂贵的任务。 在本文中,我们提出了一种用于小目标检测的数据增强的完整流程,该流程将基于GAN的目标生成器与目标分割、图像修复和图像混合技术相结合,以实现高质量的合成数据。我们的流水线的主要组件是DS-GAN,这是一种基于GAN的新型架构,可以从较大的对象生成逼真的小对象。实验结果表明,我们的整体数据增强方法将最先进模型的性能提高了11.9%AP@。在UAVDT上5 s和4.7%AP@。iSAID上的5s,无论是对于小目标子集还是对于训练实例数量有限的场景。

02

大厂算法面试:使用移动窗口查找两个不重叠且元素和等于给定值的子数组

根据”老朽“多年在中国IT业浸淫的经验,我发现无论大厂还是小厂,其算法面试说难也不难。难在于算法面试的模式都是在给定网站上做算法题,90分钟做三道。我自认个人水平在平均线以上,但通过多次尝试发现,要在90分钟内完成给定算法题非常困难,这还是在我有过多年算法训练的基础上得出的结论,特别是这些题目往往有一些很不好想到的corner case,使得你的代码很难快速通过所有测试用例,我们今天要研究的题目就属于有些特定情况不好处理的例子。此外“不难”在于,很多公司的面试算法题其特色与整个行业类似,那就是缺乏原创,中国公司90%以上的面试算法题全部来自Leetcode,因此刷完后者,甚至把后者那五百多道题”背“下来,你基本上能搞定,国内仿造hackerrank的牛X网,其题目就是这个特点。

02

AI综述专栏 | 跨领域推荐系统文献综述(上)

跨领域推荐系统(Cross domain recommender systems,CDRS)能够通过源领域的信息对目标领域进行辅助推荐,CDRS由三个基本要素构成:领域(domain),用户-项目重叠场景(user-item overlap scenarios)和推荐任务(recommendation tasks)。这篇研究的目的就是明确几种广泛使用的CDRS三要素的定义,确定它们之间的通用特征,在已明确的定义框架下对研究进行分类,根据算法类型将同类研究进行组合,阐述现存的问题,推荐CDRS未来的研究方向。为了完成这些目标,我们挑选出94篇文献进行分析并最终完成本综述。我们根据标签法对选出的文献进行分类,并且设计了一个分类坐标系。在分类坐标系中,我们发现研究类域的文献所占权重最大,为62%,研究时域的文献所占权重最小,为3%,和研究用户-项目重叠场景的文献所占权重相同。研究单目标领域推荐任务的文献占有78%,研究跨领域推荐任务的文献只有10%。在29个数据集中,MovieLens所占权重最大,为22%,Yahoo-music所占权重最小,只有1%。在7种已定义算法类别中,基于因式分解的算法占了总数的37%,基于语义分析的算法占了6%。最终,我们总结出5种不同的未来研究方向。

01

object detection中的非极大值抑制(NMS)算法

前言 什么是NMS算法呢?即非极大值抑制,它在目标检测、目标追踪、三维重建等方面应用十分广泛,特别是在目标检测方面,它是目标检测的最后一道关口,不管是RCNN、还是fast-RCNN、YOLO等算法,都使用了这一项算法。 一、概述 非极大值抑制(Non-Maximum Suppression,NMS),顾名思义就是抑制不是极大值的元素,可以理解为局部最大搜索。这个局部代表的是一个邻域,邻域有两个参数可变,一是邻域的维数,二是邻域的大小。这里不讨论通用的NMS算法(参考论文《Efficient Non-Maximum Suppression》对1维和2维数据的NMS实现),而是用于目标检测中提取分数最高的窗口的。例如在行人检测中,滑动窗口经提取特征,经分类器分类识别后,每个窗口都会得到一个分数。但是滑动窗口会导致很多窗口与其他窗口存在包含或者大部分交叉的情况。这时就需要用到NMS来选取那些邻域里分数最高(是行人的概率最大),并且抑制那些分数低的窗口。 NMS在计算机视觉领域有着非常重要的应用,如视频目标跟踪、数据挖掘、3D重建、目标识别以及纹理分析等。本文主要以目标检测中的应用加以说明。

05
领券