在YOLACT/YOLACT++中获取预测输出掩码的多边形坐标

YOLACT（You Only Look At CoefficienTs）及其进阶版本YOLACT++是一种实时实例分割算法，它能够在单个前向传递中同时预测目标的类别、边界框和掩码。以下是关于获取预测输出掩码的多边形坐标的基础概念和相关信息：

基础概念

实例分割：识别图像中每个对象的像素级分割，区分不同的对象实例。
掩码预测：YOLACT模型通过预测一组掩码系数和一个原型掩码来生成实例掩码。
多边形坐标：将掩码转换为多边形表示，通常用于后续处理，如渲染或与其他系统的集成。

类型与应用场景

类型：YOLACT++是对原始YOLACT的改进，提高了掩码的质量和模型的整体性能。
应用场景：自动驾驶、视频监控、机器人视觉、增强现实等领域。

获取预测输出掩码的多边形坐标

在YOLACT/YOLACT++中，获取预测掩码的多边形坐标通常涉及以下步骤：

获取掩码系数和原型掩码：模型会输出每个检测到的对象的掩码系数和一组原型掩码。
生成实例掩码：使用掩码系数与原型掩码相乘并求和，得到每个对象的实例掩码。
转换为多边形：将实例掩码转换为多边形坐标。这通常通过查找掩码的轮廓来实现。

示例代码

以下是一个简化的Python示例，展示如何从掩码生成多边形坐标：

import numpy as np
from skimage import measure

def mask_to_polygon(mask):
    # 找到掩码的轮廓
    contours = measure.find_contours(mask.astype(np.uint8), 0.5)
    
    # 将轮廓转换为多边形坐标列表
    polygons = []
    for contour in contours:
        polygon = contour.tolist()
        polygons.append(polygon)
    
    return polygons

# 假设你已经有了一个实例掩码
instance_mask = ... # 形状为 (height, width) 的二值掩码

# 获取多边形坐标
polygons = mask_to_polygon(instance_mask)
print(polygons)

可能遇到的问题及解决方法

问题：生成的掩码不准确或存在噪声。

原因：可能是由于训练数据不足、模型过拟合或后处理步骤不当。

解决方法：

使用更多的标注数据进行训练。
应用数据增强技术来提高模型的泛化能力。
调整后处理参数，如轮廓检测的阈值。

问题：转换多边形时丢失了一些细节。

原因：轮廓检测算法可能过于简单，无法捕捉到复杂的形状。

解决方法：

尝试使用更复杂的轮廓检测算法。
对掩码进行预处理，如平滑或去噪，以改善轮廓检测的结果。

通过以上步骤和方法，你可以有效地从YOLACT/YOLACT++模型的预测输出中获取掩码的多边形坐标。

在YOLACT/YOLACT++中获取预测输出掩码的多边形坐标

、、、、

我正在使用Yolact https://github.com/dbolya/yolact，这是一种实例分割算法，它输出带有检测对象上的蒙版的测试图像。由于输入图像是使用annotations.json中输入类周围的多边形坐标给出的，因此我希望得到这样的输出。但是我不知道如何提取这些轮廓/多边形的<

浏览 38提问于2020-10-20得票数 1

回答已采纳

3回答

将注记从Mask-RCNN数据集格式转换为COCO格式

、、、、

我想训练一个在图像中检测车辆和道路的模型。为此，我将使用Mask R-CNN和YOLACT++。我用vgg图像注释器为Mask R-CNN标记了一些图像，分割点如下图所示。 ? 我可以使用minx miny maxx maxy找到我的实例的bbox，但我找不到如何找到该分割区域的区域。您可以在下图中看到Yolact注释的形成。 ? 标记所有实例需要大量时间。我花了至少10分钟来标记图像中

浏览 104提问于2020-04-14得票数 5

回答已采纳

2回答

如何在python中通过坐标裁剪光栅图像？

、、、、

我在UTM32中有一个UTM32，在UTM32中有一个矩形的坐标。(这种预测可能并不总是这样，但预测总是一样的)699934.584491, 700160.946739, 6168703.00544, 6169364.0093 我知道如何从点生成多边形，如何从多边形生成但是，我不知道如何使用多边形、sh

浏览 1提问于2016-07-07得票数 4

1回答

lab的彩色分割

、、、

我正在使用MatLab网站上的代码“使用L_a_b*颜色空间进行基于颜色的分割”：我不知道什么时候应该保存region_coordinates并执行size(region_coordina

浏览 4提问于2015-01-13得票数 2

回答已采纳

2回答

如何对在较大图像中绘制的多边形应用高斯模糊

、、

我想在较大的图像中对多边形的像素坐标应用高斯模糊，然后在相同的坐标上对模糊的多边形做一些事情。skimage中的draw polygon函数直接给出了图像的坐标，而不是蒙版。理想情况下，我希望将滤镜应用于掩码本身，但draw polygon函数不会得到掩码。我显然不能首先在图像上运行高斯模糊，因为如果我

浏览 43提问于2019-02-17得票数 0

回答已采纳

1回答

如何从位掩码绘制多边形修补程序

、

在matplotlib中，我使用matplotlib.pyplot.imshow显示了一个图像。我还知道如何绘制填充的。所需的参数之一是xy，这是一个形状(N，2)的numpy数组，其中每个N行表示多边形点的x-y坐标。现在，在图像上呈现的填充多边形也可以用位掩码(与图像的高度和宽度相同)表示，填充为1s，否则为0。我的问题是，如果我有位<e

浏览 11提问于2021-12-17得票数 2

回答已采纳

1回答

从Wikimapia API获取坐标

、、

，我应该选择什么格式来轻松地从它获取多边形坐标？，如何获得文件的坐标和地名？，如何从API输出中生成变量？我想用这个信息在地图API中画多边形。

浏览 6提问于2012-03-31得票数 1

2回答

用多边形标记图像比用方形标记好吗？

、、、、

我的目标是建立一个目标检测模型，我用方形框标记数据，如果我用多边形标记图像，它会比方形更好吗？(在戴安全帽或不戴安全帽的人的图像上贴上标签) 我确实尝试过在一些图片上贴上多边形形状的标签，在导出txt文件后，为什么它在文本文件中只有4个点，就像用正方形标记的一样，这些点如何表示我所准确标注的区域

浏览 1提问于2021-04-09得票数 0

回答已采纳

2回答

Python查找"n“最近的相邻群(坐标)

、、、、

目标：给定一个坐标X，找到坐标X的"n“最近线多边形，而不仅仅是"n”最近点。示例：我有一组空间线多边形，可以有两个以上的坐标。它们的坐标存储在KDtree中，以便进行NN搜索。首先，我将查询最近坐标的"i“号，然后查找对应的线-多边形-> "i”坐标可能不一定生成"i

浏览 1提问于2018-08-27得票数 2

回答已采纳

2回答

如何利用凸包多边形裁剪人脸区域

、、、、

我使用dlib库中的地标点从我的脸上选择额头、鼻子和眼睛区域，基于这个问题：。它就像一种魅力，我有我想要它们的点，我想要做的是用凸起多边形裁剪地标的图像。我想做的是从这一点出发：对此：然后再保存下来import cv2from imutils import face_utilsimport numpy as

浏览 6提问于2021-02-18得票数 1

回答已采纳

10回答

使用Google Map API v3绘制多边形并获取坐标

、

我想要做的是；首先让用户在Google Map上绘制一个多边形，并获取他/她的多边形的坐标并将其保存到数据库中。然后，我将向用户显示保存的坐标。我不知道如何让用户使用v3接口在Google Map上绘制多边形，然后获得坐标。如果我能得到这些坐标，就很容易将它们保存到数据库中。几乎就是一个例子，但它使

浏览 5提问于2011-02-22得票数 33

1回答

多边形包围盒的计算面积

、

我试图计算多边形包围框的面积，并将多边形顶点的坐标(x和y)保存在掩码变量中。这是我的密码：data = json.load(f)for i in data.keys(): # iterate overprint(mask) area = (mask[:, 3] - mask[:, 1]) * (mask[:, 2] - mask[:

浏览 4提问于2022-10-04得票数 0

回答已采纳

1回答

C++/Qt中的闭合轮廓

、

我在2D平面上有一组点(std::pair of double)，我想要应用一个掩码(它是一个封闭的轮廓:正方形、圆形、多边形.)干杯。如果一个点包含在掩码(或掩码下面)，它不会出现，否则就会出现.。例如，如果掩码是一个矩形，其左上角的坐标为(m_x,m_y)，而m_width和m_height为其宽度和高度，则一个点将包含在掩码中(不应该出现)，如果： if (x >= m_x &&

浏览 5提问于2016-05-18得票数 0

回答已采纳

1回答

如何将PostGIS多边形和弦转换为lat和lng？

、、、、

从json中，我获取显示为多边形的区域的数据。在这里可以找到一个端点示例： 6213244.042039478 "type": "Point&quo

浏览 3提问于2019-09-19得票数 1

回答已采纳

1回答

线性变换输出的损失和用于训练的基本事实

、、、

我在pytorch中有一个预测模型，它在特定的坐标系中获取输入并生成输出。在我的过程中，我将输出和地面实况转换到不同的坐标系(二维平移和旋转)。我现在可以计算两个坐标系中的损失，它们具有相同的值(RMSE和NLL损失)。在训练中使用哪个损失来运行loss.backward(

浏览 1提问于2020-08-03得票数 0

1回答

给定一个坐标向量，从其落入的形状文件中识别多边形。

、、

我将多边形存储在SpatialPolygonsDataFrame中，坐标存储在数据帧中。但是它的输出有点不同。而且，有点慢。

浏览 1提问于2018-03-15得票数 0

回答已采纳

1回答

从推理传递器接收坐标

、、、、

我正在尝试获取由Pytorches DefaultPredictor生成的掩码内像素的坐标，稍后获取多边形角，并在我的应用程序中使用这个。现在，由于我需要获取掩码内部的像素坐标，简单的解决方案似乎是在pred_masks中循环，检查值，如果== "True“创建这些元组并将它们添加到列表中。然而，当我

浏览 2提问于2021-03-31得票数 0

回答已采纳

1回答

将多边形或立方体表示为opengl中的集合天井

、、、

我想将立方体或多边形表示为一个集合粒子，这样就可以将它划分为空间网格。背后的原因是，我想计算流体粒子(SPH技术)与固体物体，如建筑物，地形碰撞。如何将固体物体表示为粒子的集合？

浏览 1提问于2015-03-13得票数 2

回答已采纳

2回答

使用Tensor.cpu()首先将张量复制到主机内存(使用yolact* edge进行分割)*

、、、

我正在对yolact边缘进行分割。我正在尝试使用我自己的算法找到掩码的最小和最大x和y像素的坐标。我正在尝试将元组的值转换为numpy。np.append(xmin,x_min) print(xmin) print(xmax) 注意:T是一个pytorch张量，由包含t3中掩码数据的默认程序输出输出： t

浏览 346提问于2021-07-07得票数 2

回答已采纳

1回答

在OpenGL中，在创建3D纹理之后，我们总是需要绘制一个代理几何体，比如GL_QUADS来包含3D纹理，并在这个函数中设置纹理坐标: glTexCoord3f。然而，当我在CUDA中使用3D纹理时，我从来没有找到像glTexCoord3f这样的函数来指出纹理坐标。实际上，我们只是使用CUDA数组，然后将该数组绑定到纹理。之后，我们可以使用纹理获取函数tex3D来获取该值。因此，我很困惑，即使我们以前从未设置过纹理

浏览 2提问于2012-04-12得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在YOLACT/YOLACT++中获取预测输出掩码的多边形坐标

基础概念

相关优势

类型与应用场景

获取预测输出掩码的多边形坐标

示例代码

可能遇到的问题及解决方法

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐