如果我有两个图像掩码作为numpy数组，我如何将它们重叠在一起。考虑重叠和非重叠区域 - 腾讯云开发者社区

您找到你想要的搜索结果了吗？

是的

没有找到

20个不常见但却非常有用的Numpy函数

Numpy是每个数据科学家都应该掌握的Python包，它提供了许多创建和操作数字数组的方法。它构成了许多与数据科学相关的广泛使用的Python库的基础，比如panda和Matplotlib。

20 个不常见却很有用的 Numpy 函数

教程 | 先理解Mask R-CNN的工作原理，然后构建颜色填充器应用

（数据科学学习手札87）利用adjustText解决matplotlib文字标签遮挡问题

让Jetson NANO看图写话

今天这个项目来自 Dimiter Kendri，是NVIDIA Jetson 社区项目里的一个

圣诞快到了，可视化一个圣诞老人。

作者 | Francesco Palma，Davide Burba，Lewis Tunstall，Thomas Boys

Matplotlib 中文用户指南 8.2 我们最喜欢的秘籍

这里是一个简短的教程，示例和代码片段的集合，展示了一些有用的经验和技巧，来制作更精美的图像，并克服一些 matplotlib 的缺陷。

实例分割论文调研_论文案例分析模板

A Survey on Instance Segmentation: State of the art 链接解读https://zhuanlan.zhihu.com/p/165135767

业界 | Uber提出SBNet：利用激活的稀疏性加速卷积网络

Soft-NMS – Improving Object Detection With One Line of Code

非最大抑制是目标检测流程的重要组成部分。首先，它根据所有检测框的得分对它们进行排序。选择得分最大的检测框M，抑制与M有显著重叠(使用预定义阈值)的所有其他检测框。这个过程递归地应用于其余的框。按照算法的设计,如果一个目标重叠在预定义的阈值,就丢弃它。为此,我们提出Soft-NMS,衰变的算法检测的所有其他目标作为一个连续函数的重叠与m。因此，没有目标在这一过程中消除。Soft-NMS获得一致的改善coco-stylemAP指标，在标准数据集PASCAL VOC 2007 (RFCN 和Faster-RCNN上为) MS-COCO (R-FCN上1.3% 和Faster-RCNN上为 .1%) 没有过改变任何额外的hyper-parameters。NMS算法使用Deformable R-FCN，Sost-NMS在单一模型下将目标检测的最新水平从39.8%提高到40.9%。此外，Soft-NMS和传统的NMS计算复杂度很接近，因此能够有效实现。由于Soft-NMS不需要任何额外的训练，而且易于实现，因此可以轻松地集成到任何目标检流程中。

就是这么霸道，使用OpenCV10行代码实现人脸检测

虽然互联网上有很多关于 OpenCV 的 Haar Cascade 对象检测模块这方面的技术资料，但这篇文章的重点是通俗易懂地解释这些概念，希望这能帮助初学者以简单的方式理解 Python 的 OpenCV 库。

【python opencv】直方图查找、绘制和分析

那么直方图是什么？您可以将直方图视为图形或绘图，从而可以总体了解图像的强度分布。它是在X轴上具有像素值（不总是从0到255的范围），在Y轴上具有图像中相应像素数的图。

教你如何利用机器学习破解网站验证码

本文介绍了一种使用机器学习技术绕过网站验证码的方法。首先，作者通过分析网站验证码图像，提取出每个字符的图像特征，然后使用这些特征训练一个分类器。之后，作者使用一个预先训练的模型，在10分钟内对10,000个验证码图像进行分类。最后，作者使用训练好的模型对真实验证码进行解码，发现该模型能够成功地绕过大多数网站上的验证码。

PPDet：减少Anchor-free目标检测中的标签噪声，小目标检测提升明显

论文地址：https://arxiv.org/pdf/2008.01167.pdf

使用OpenCV和Python标记超像素色彩

【Labeling superpixel colorfulness with OpenCV and Python】，仅做学习分享。

使用opencv实现实例分割，一学就会|附源码

无论是从酒店房间接听电话、在办公里楼工作，还是根本不想在家庭办公室等情况，电话会议模糊功能都可以让会议与会者专注于自己，这样的功能对于在家工作并希望保护其家庭成员隐私的人特别有用。为了实现这样的功能，微软利用计算机视觉、深度学习以及实例分割技术实现。在之前的博文中，介绍了如何利用YOLO以及OpenCV实现目标检测的功能，今天将采用Mask R-CNN来构建视频模糊功能。

CapsNet

在讲胶囊网络之前，首先我们回顾一下我们熟悉的CNN。 CNN做了什么事情呢? 假设这里有一个卷积核（左图），除了曲线轨迹上的值很大，其他的值都是零，所以这个卷积核对旁边这种曲线（右图）就有很高的输出，

OpenCV 实战：3 步实现图像降噪

本文将展示如何通过三个简单的步骤来实现降噪。我们将使用机器学习训练的降噪模型，最好的降噪模型之一。

经典的计算机视觉项目–如何在视频中的对象后面添加图像

一位同事带来了一个挑战-建立一个计算机视觉模型，该模型可以在视频中插入任何图像而不会扭曲移动的对象。正如所想象的那样，这是一个非常有趣的项目，而对此进行了大量工作。

设计图太多？你可以这样对比和管理

从开始到结束，设计稿的每个版本都是很重要的，设计师需要无数次的对比，才能无数次的优化，回想那些恐怖的场景：

同质化严重，Pandas和Numpy的若干小技巧

在Python的数据处理中，频繁用到的两大神器就是Pandas和Numpy了，熟练并花哨的使用这两个库不但能让你的据处理过程缩小代码量还能有效提高数据处理效率。不过随着Python的流行，这类Pandas和Numpy技巧文已经大量同质化，本着为地学而钻研的精神，我整理了我在数据处理过程中常用的几个小技巧。

【python-opencv】图像上的算术运算

您可以通过OpenCV函数cv.add()或仅通过numpy操作res = img1 + img2添加两个图像。两个图像应具有相同的深度和类型，或者第二个图像可以只是一个标量值。

(Python)用Mask R-CNN检测空闲车位

我住在一个大城市。但就像大多数城市一样，在这里寻找停车位总是一件很困难的事情。停车位通常很快被抢走，即使你有一个专门的停车位，朋友们来拜访你也是一件很困难的事，因为他们找不到停车位。

AI如何能比人类的眼睛看得更清楚？通俗的解释卷积神经网络

本文介绍了现代计算机视觉的主要思想。我们探索如何将数百个学习图像中低级特征的神经元堆叠成几层。

Unity OpenVR 虚拟现实入门五：通过传送控制玩家移动

在 Unity 的帮助下，虚拟现实应用的开发非常容易。不过国内竟然还是没有什么教程，所以这里就来一点入门的，适合新手。

新技术：高效的自监督视觉预训练，局部遮挡再也不用担心！

关注并星标从此不迷路计算机视觉研究院公众号ID｜ComputerVisionGzq 学习群｜扫码在主页获取加入方式论文地址：https://arxiv.org/pdf/2206.00790.pdf 计算机视觉研究院专栏作者：Edison_G 计算机视觉的自监督学习取得了巨大的进步，并改进了许多下游视觉任务，例如图像分类、语义分割和对象检测。 01 概要简介计算机视觉的自监督学习取得了巨大的进步，并改进了许多下游视觉任务，例如图像分类、语义分割和对象检测。其中，生成式自监督视觉学习方法如M

使用OpenCV，Python和模板匹配来播放“Waldo在哪里？”

这是一篇来自PyImageSearch的Adrian Rosebrock的博客，他的博客内容包括计算机视觉，图像处理和建筑图像搜索引擎等。

Python3 OpenCV4 计算机视觉学习手册：1~5

您已经读了这本书，因此您可能已经对 OpenCV 是什么有了个概念。也许您听说过似乎来自科幻小说的功能，例如训练人工智能模型以识别通过相机看到的任何东西。如果这是您的兴趣，您将不会感到失望！ OpenCV 代表开源计算机视觉。它是一个免费的计算机视觉库，可让您处理图像和视频以完成各种任务，从显示网络摄像头中的帧到教机器人识别现实中的物体。

ECCV 2018 | GANimation让图片秒变GIF表情包，秒杀StarGAN

如果一张图片中的面部表情可以自动变成动画形式，就会打开许多不同领域新应用的大门，包括电影产业、摄影技术、时尚界和电子商务等。随着生成对抗网络的流行，这项任务取得了重大的进展，例如 StarGAN 这样的架构不仅能够合成新表情，还能更改面部的其它属性，如年龄、发色、性别等。尽管 StarGAN 很通用，但它只能在由数据集的注释粒度定义的离散属性中改变面部一个特定的部分。例如，在面部表情合成任务中，StarGAN 在数据集 RaFD 上进行训练，该数据集上只有八种二元标签，分别是悲伤、中立、愤怒、轻蔑、厌恶、惊讶、恐惧和快乐。

Robust Data Augmentation Generative Adversarial Networkfor Object Detection

基于生成对抗性网络（GAN）的数据扩充用于提高目标检测模型的性能。它包括两个阶段：训练GAN生成器以学习小目标数据集的分布，以及从训练的生成器中采样数据以提高模型性能。在本文中，我们提出了一种流程化的模型，称为鲁棒数据增强GAN（RDAGAN），旨在增强用于目标检测的小型数据集。首先，将干净的图像和包含来自不同域的图像的小数据集输入RDAGAN，然后RDAGAN生成与输入数据集中的图像相似的图像。然后，将图像生成任务划分为两个网络：目标生成网络和图像翻译网络。目标生成网络生成位于输入数据集的边界框内的目标的图像，并且图像转换网络将这些图像与干净的图像合并。定量实验证实，生成的图像提高了YOLOv5模型的火灾检测性能。对比评价表明，RDAGAN能够保持输入图像的背景信息，定位目标生成位置。此外，消融研究表明，RDAGAN中包括的所有组件和物体都发挥着关键作用。

CVPR 2018 | 中科大&微软提出立体神经风格迁移模型，可用于3D视频风格化

选自arXiv 作者：Dongdong Chen等机器之心编译参与：Nurhachu Null、刘晓坤近年来，在自然图像上再现名画风格的风格转换技术成为内容创作的热门话题。例如，最近的电影「至爱梵高」是第一部完全由训练有素的艺术家制作的动画电影。然而，目前还没有将风格转换应用于立体图像或视频的技术。现有的风格迁移方法会使左右视图不一致的风格化纹理，研究者通过解决该问题，突破了立体风格迁移的一大瓶颈。立体 3D 正在成为一种大众消费媒体，例如 3D 电影、电视以及游戏。现在，随着头戴式 3D 显示器（

使用Mask-RCNN在实例分割应用中克服过拟合

代码：https://github.com/kayoyin/tiny-inst-segmentation

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐