开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

如何使用CustomVision接口返回边界框的绝对坐标？

CustomVision是微软提供的一个自定义视觉服务，它允许用户训练自定义图像分类器和对象检测模型。在使用CustomVision接口时，返回的边界框（Bounding Box）坐标通常是相对于图像尺寸的归一化坐标，范围在0到1之间。要获取边界框的绝对坐标，你需要将这些归一化坐标转换为图像的实际像素坐标。

以下是获取边界框绝对坐标的步骤：

获取归一化坐标：当你调用CustomVision的API来检测图像中的对象时，返回的结果中会包含边界框的归一化坐标。这些坐标通常表示为left, top, width, height，其中left和top是边界框左上角的归一化坐标，width和height是边界框的宽度和高度。
获取图像尺寸：你需要知道图像的实际宽度和高度（以像素为单位），这可以通过图像处理库或者直接从图像文件中获取。
计算绝对坐标：使用以下公式将归一化坐标转换为绝对坐标：
计算绝对坐标：使用以下公式将归一化坐标转换为绝对坐标：
这样，left_absolute, top_absolute, right_absolute, bottom_absolute就是边界框的绝对坐标。
应用场景：获取边界框的绝对坐标对于多种应用场景都是必要的，例如在图像上绘制边界框、裁剪图像中的对象、或者在视频流中实时跟踪对象等。
可能遇到的问题及解决方法：
- 如果归一化坐标超出了0到1的范围，可能是由于模型训练或预测时的错误导致的。需要检查模型的训练数据和预测代码。
- 如果图像尺寸获取不正确，可能会导致计算出的绝对坐标错误。确保使用的是正确的图像尺寸。
- 在处理大量数据时，性能可能成为一个问题。可以考虑优化代码或者使用更高效的数据处理方法。

请注意，以上代码示例仅供参考，实际应用中可能需要根据具体情况进行调整。如果你在使用CustomVision接口时遇到具体问题，可以参考微软官方文档或者在Stack Overflow等社区寻求帮助。

相关搜索:如何获取检测到的对象的边界框坐标如何在Python中找到旋转边界框的坐标？如何在dlib中获取dets边界框的坐标？如何使用边界框坐标裁剪图像中的感兴趣区域？如何使用序列的已知边界框数据估计丢失的边界框输出？如何使用R以行的方式提取边界框？如何使用旋转计算出旋转梯形的边界框在csv中提取视频的坐标和帧号时，如何在视频上绘制边界框？如何使用查找轮廓open cv来增加边界框的大小？MapQuest/Leaflet -如何使用gps坐标跟踪选取框之间的路线？如何在postGIS中获取与某一点相距一定距离的边界框坐标？如何使用tensorflow对象检测API统计检测到的对象(在边界框中)的数量如何在不使用绝对值的情况下使对话框变大？如何根据R中最近的位置使用坐标对数据框中的行子集如何使用Kotlin中返回Self的静态函数编写接口？如何使用fastai为自定义训练的图像分类器的预测类绘制边界框我们如何在不使用LabelImg等工具的情况下在图像中绘制边界框？如何使用PCL或Matlab围绕点云中的不同对象创建三维边界框？使用Haarcascade检测到的人脸，如何在不同颜色的相同人脸上绘制边界框 C# -如何使用Tesseract 3.0包装器来获取每个字符的边界框？

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

如何使用php调用api接口，获得返回json字符的指定字段数据

如何使用php调用api接口，获得返回json字符的指定字段数据今天试着用php调用远程接口，获取调用接口后的数据，将其记录下来，方便日后调用。...开始调用逻辑：先合并出需要调用的接口以及参数然后用php中file_get_contents()函数，获取接口返回的所有内容。...最后再通过json_decode，将获取到的内容进行json解码，然后进行输出，得到想要的结果。（这里调用接口，获得百度域名的备案主体的信息）。...下面是输出的结果：下面是直接访问上方接口返回的内容最后，将上面的示例代码放出来。需要的可以免登录，下方评论拿走即可！本文共 220 个字数,平均阅读时长 ≈ 1分钟

8.4K3 0

tf.image.non_max_suppression

删除与先前选择的框具有高交叉-过度联合(IOU)重叠的框。...边界框以[y1, x1, y2, x2]的形式提供，其中(y1, x1)和(y2, x2)为任意对角对角框角的坐标，坐标可以标准化(即，位于区间[0,1]或绝对区间。...注意，这个算法不知道原点在坐标系中的什么位置。注意，这个算法对于坐标系的正交变换和平移是不变的;因此，坐标系统的平移或反射会导致算法选择相同的框。...这个操作的输出是一组整数，索引到表示所选框的边界框的输入集合中。然后使用tf可以获得与所选索引对应的边界框坐标。收集操作。例如:selected_indices = tf.image。...返回值:selected_indices:形状[M]的一维整数张量，表示从box张量中选择的指标，其中M <= max_output_size。

1.5K2 0

使用OpenCV搭建违章停车检测系统

感兴趣区域的选择如下图所示现在，我们有了感兴趣的区域或禁止车辆停放的地方的像素的所有坐标点。然后我们选取车辆的边界框坐标（如何识别车辆呢，可以参考小白之前的文章）。但是，这又带来了一个问题。...如果相机离这个感兴趣区域太近，当有车辆接近该区域时，它的边界框会占据非常多的坐标点，当同时有车辆时，必须对视频的每一帧重复这个过程，导致帧率急剧下降。...此外，当该条件为真时，将会有关于边界框的前一帧日志详细信息获取到另一个名为previous_bbox_co_str的变量中。现在我们知道了车辆在当前帧和前一帧的边界框坐标。...previous_bbox_co_str作为函数的属性，以及当前的边界框坐标。...需要注意，即使车辆或任何物体完全停止，YOLO 也会给出波动的边界框坐标。为避免这个现象并使此过程稳健，我们在此处将判定变量设置为比较高的值。该值越高，程序对边界框的随机波动就越鲁棒。

4683 0

比较目标检测模型性能的统计量，了解一下？

一个例子我们给定了真实图片（jpg， png 等格式）和其他解释性文字（边界框的坐标（ x， y，宽度和高度）和类别），画在图片上的红色框和文本标签只是方便我们自己观看。...，坐标值大小是估计的）让我们实际操作一下，看看 mAP 是如何计算的。...我们用模型对原始图像进行处理，下面是目标检测模型在置信度阈值化之后返回的结果。带有边界框的图像：来自我们模型的结果我们可以说这些检测结果是正确的，但是我们怎么量化呢？...这个统计量也叫做 Jaccard 指数（Jaccard Index），是由 Paul Jaccard 在 20 世纪初首次提出的。要获得交集和并集的值，我们首先把预测边界框覆盖在参考边界框之上。...（如图所示）现在对于每个类别，预测边界框和参考边界框的重叠部分叫做交集，而两个边界框跨越的所有区域叫做并集。

9404 1

平均精度均值(mAP)——目标检测模型性能统计量

一个例子　　我们给定了真实图片（jpg， png 等格式）和其他解释性文字（边界框的坐标（ x， y，宽度和高度）和类别），画在图片上的红色框和文本标签只是方便我们自己观看。 ?...实际图片　　以及三组定义了参考标准的数字（让我们假设这张图片的分辨率是 1000 x 800 像素，表中所有坐标的单位都是像素，坐标值大小是估计的） ? 　　...我们用模型对原始图像进行处理，下面是目标检测模型在置信度阈值化之后返回的结果。　　带有边界框的图像： ? 来自我们模型的结果　　我们可以说这些检测结果是正确的，但是我们怎么量化呢？　　...这个统计量也叫做 Jaccard 指数（Jaccard Index），是由 Paul Jaccard 在 20 世纪初首次提出的。　　要获得交集和并集的值，我们首先把预测边界框覆盖在参考边界框之上。...（如图所示）　　现在对于每个类别，预测边界框和参考边界框的重叠部分叫做交集，而两个边界框跨越的所有区域叫做并集。 ?

1.6K2 0

Hands On GUI Application Development in Go

，也就完成了界面元素的创建；但此时的界面元素是孤独的，与其他界面元素没有形成联系（没有父母，没有兄弟姐妹）界面元素如何被管理新创建的界面元素纳入管理的过程，就是为其添加父母，兄弟姐妹的过程。...使用的函数接口为connect();从此该界面元素会跟其他界面元素一样，纳入一棵树中，并随之响应用户可能的点击操作。...没法发生变化，将返回NULL snap_shot 生成当前显示的快照，并输出到bitmap文件。...left：surface指定区域的左边界坐标；top：surface指定区域的上边界坐标；right：surface指定区域的右边界坐标；bottom：surface指定区域的下边界坐标 is_valid...rect：用于输出位置信息 get_screen_rect 获取自己（this）相对于UI系统的绝对位置信息。

1.1K1 0

1小时快速搭建基于Azure Custom Vision和树莓派的鸟类分类和识别应用

我们这里就使用门户的方式上传。具体步骤如下：在自定义视觉门户中创建项目：转到 https://www.customvision.ai/projects 并登录。...窗格中的“正在训练...” 通知指示正在进行训练。训练完成时，将显示有关如何为正在训练的迭代执行模型的信息。...在“如何使用预测 API”的“如果你有一个图像 URL”下的文本框中，复制并保存该值，然后选择“获取”。 ?...树莓派应用构建树莓派中，我们要使用到custom vision的python SDK，所以我们要使用pip工具安装以下库： 1 pip3 install azure-cognitiveservices-vision-customvision...14所示，图中我们可以看到，返回的结果里面，将识别的鸟类用红色框进行了标注。

1.1K2 0

原创 | 一文读懂多模态强化学习

在利用交叉注意力层对输入提示进行编码过程中，冻结预训练语言模型和解码机器人动作命令， VIMA采用以物体为中心的表示，从边界框坐标和裁剪的RGB补丁中计算标记。...对于文本输入，使用预训练的T5标记器和词嵌入来获取单词标记；对于完整桌面场景的图像，首先使用域微调的Mask R-CNN 提取出单个物体。将每个物体表示为装订框和裁剪的图像。...然后，通过使用边界框编码器和ViT 分别对其进行编码来计算出物体标记。...由于Mask R-CNN的不完美性，物体的边界框可能会有噪声，裁剪的图像可能具有不相关的像素；对于单个物体的图像，以相同的方式获取标记，使用虚拟边界框。...边界框的格式为 xcenter, ycenter, height, width（横坐标中心，纵坐标中心，高度和宽度），将每个维度值除以上边界的坐标值之后，对边界框格式值进行归一化，使其在[0,1] 之间

6961 0

手把手教你使用PyTorch从零实现YOLOv3（1）

解释输出通常，（与所有目标检测器一样）将卷积层学习到的特征传递到分类器/回归器上，该分类器/回归器进行检测预测（边界框的坐标，类标签等）。在YOLO中，通过使用1 x 1卷积的卷积层来完成预测。...B表示每个单元格可以预测的边界框的数量。根据本文，这些B边界框中的每一个都可以专门用于检测某种对象。每个边界框都有5+C属性，这些属性描述每个边界框的中心坐标，尺寸，置信度得分和C类置信度。...做出预测以下公式描述了如何转换网络输出以获得边界框预测。 ? YOLO方程 bx，by，bw，bh是我们预测的x，y中心坐标，宽度和高度。tx，ty，tw，th是网络输出的内容。...通常，YOLO不会预测边界框中心的绝对坐标。它预测的偏移量是：相对于预测对象的网格单元的左上角。通过特征图中的像元尺寸进行归一化，即1。例如，考虑我们的狗的形象。...现在在步幅为16的层上进行另一次检测。重复相同的上采样过程，并在步幅8的层上进行最终检测。在每个尺度上，每个像元使用3个锚来预测3个边界框，使使用的锚总数为9。（不同尺度的锚是不同的） ?

3.6K1 1

Avalonia中的线性渐变画刷LinearGradientBrush

坐标系统与边界框无关。...坐标系统是相对于边界框的:0表示边界框的0%，1表示边界框的100%。例如，(0.5,0.5)描述边界框中间的一个点，(1,1)描述边界框右下角的一个点。...于是可以确定是Polygon的使用上不对，根据Polygon的填充色#377af5，我猜测跟Polygon的坐标有关，调整Polygon的位置后填充色会发生变化，于是修改Polygon的坐标，结果得到了想要的渐变色三角形...由于相对模式的坐标系统是基于本地空间，这样并没有解决Points="240 19 240 40 220 19"的Polygon实现渐变效果的需求，继而需要寻求绝对值模式的解决方式。...归纳了以下几点内容： Avalonia中线性渐变画刷既支持相对模式，也支持绝对模式。 StartPoint和EndPoint的取值为百分比时使用的相对模式，取值为数值则是绝对模式。

2611 0

超详细的Java容器、面板及四大布局管理器应用讲解！

实现一个带有滚动条的文本框。...绝对布局管理器除了网格布局管理器、流布局管理器、边界布局管理器这三种布局方式以外，还有一种较为不同的布局方式就是绝对布局，所谓绝对布局，就是按照一定的坐标数据将组件的坐标和大小硬性的设置在窗体上。...：“盘点Java窗体中关于默认布局管理器容易踩的坑” 之后再使用以下方法对组件进行绝对定位： setBounds(x,y,width,height); //其中x表示组件基于容器左上角的横坐标、y表示纵坐标..., 200, 30); //为组件设置绝对坐标 container.add(jb3); //将组件添加到容器 setLayout(null); //清空布局管理器，即取消原来的边界布局管理器...在使用绝对布局管理器时值得注意的就是：在使用绝对布局之前要调用setLayout(null)方法来告知编辑器，这里将不再使用默认的布局管理器。

2.9K1 0

ECharts入门（一）基础概念概览

所以，一个系列包含的要素至少有：一组数值、图表类型（series.type）、以及其他的关于这些数据如何映射成图的参数。 echarts 里系列类型（series.type）就是图表类型。...）、polar（极坐标系底板）、geo（地理坐标系）、dataZoom（数据区缩放组件）、visualMap（视觉映射组件）、tooltip（提示框组件）、toolbox（工具栏组件）、series（系列...这种绝对定位的方式，类似于 CSS 的绝对定位（position: absolute）。绝对定位基于的是 echarts 容器 DOM 节点。...其中，他们每个值都可以是：绝对数值（例如 bottom: 54 表示：距离 echarts 容器底边界 54 像素）。...或者基于 echarts 容器高宽的百分比（例如 right: '20%' 表示：距离 echarts 容器右边界的距离是 echarts 容器宽度的 20%）。

1.2K1 0

自动驾驶汽车的伪激光雷达-双目立体视觉

计算机视觉领域在过去的十年里得到了迅猛的发展，特别是在障碍物检测方面。障碍物检测算法，如YOLO或RetinaNet提供了二维边界框，用边界框给出了障碍物在图像中的位置。...为了能够返回每个障碍物的距离，工程师们将相机与激光雷达（LiDAR，光探测和测距）传感器进行融合，后者使用激光来返回深度信息。将计算机视觉信息和激光雷达输出进行传感器的融合。...，看看我们如何使用双目立体视觉来估计物体的深度。...对于每个障碍物，该算法将返回一个包含4个数字的边界框：[x1；y1；x2；y2]。这些数字表示框的左上点和右下点的坐标。假设我们在左边的图像上运行这个算法，并且使用左边的深度图。...如下图在这个边界框中，我们可以取最近的点。知道这一点后，可以通过深度图知道了图像中每个点的距离，而且边界框中的第一个点也就是相机到障碍物的距离。

1.3K3 0

CAD复习资料

在打开的“选择线型”的对话框中单击“加载”按钮，打开“加载或重载线型”对话框。在该对话框中的可用线型中选择所需的线型。然后返回“选择线型”对话框。... ⑹返回“图层特性管理器”对话框，单机【确定】按钮，确认调用图层状态。...46、AutoCAD2004点坐标的几种表示方法：绝对坐标，相对坐标，绝对极坐标，相对极坐标。 47、如何理解图块及其属性，如何创建带有属性的块？...坐标的表示方法四种坐标的定义 1) 绝对坐标是以原点（0，0，0）为基点来定义所有的点的方法（x,y,z） 2) 相对坐标是相对于某点的相对位置（@x,y） 3) ...绝对极坐标是相对于坐标原点的距离和角度来定义任意一点的位置的默认的角度是逆时针方向来测量角度的水平向右是起始方向 200<0 4) 相对极坐标是相对于某点的极长距离和角度定义点的位置，

6.4K0 1

从零开始学Pytorch（十七）之目标检测基础

如果该目标的真实边界框已知，这里的“较好”该如何量化呢？一种直观的方法是衡量锚框和真实边界框之间的相似度。我们知道，Jaccard系数（Jaccard index）可以衡量两个集合的相似度。...那么，该如何为锚框分配与其相似的真实边界框呢？...我们看到，返回的结果的形状为(批量大小, 锚框个数, 6)。其中每一行的6个元素代表同一个预测边界框的输出信息。...剩余的4个元素分别是预测边界框左上角的 x 和 y 轴坐标以及右下角的 x 和 y 轴坐标（值域在0到1之间）。...因此，当使用较小锚框来检测较小目标时，我们可以采样较多的区域；而当使用较大锚框来检测较大目标时，我们可以采样较少的区域。为了演示如何多尺度生成锚框，我们先读取一张图像。

1.1K3 0

【Android 应用开发】Canvas 精准绘制文字 ( 测量文本真实边界 | 将文本中心点与给定中心点对齐 )

* * 在边界内返回（由调用方分配）包含所有字符的最小矩形，其隐含原点为（0,0）。...* * @param text 测量的字符串并返回其边界 * @param start 要测量字符串的起始位置 * @param end 要测量字符串的结束位置 + 1...* @param bounds 返回所有文本的联合边界。...是使用 Paint 在 Canvas 中绘制的文本的真实占用区域 , 如下图红色矩形框所在的区域 , 与文本的相对坐标 , 下图的红色矩形框的右下角是 ( 0 , 0 ) 坐标位置 ; Rect 中获取的坐标值示例..., bottom = 0 , 说明文本的底部就是基线 ; 上述 Rect 的坐标轴是这么算的 , x 轴是文本的基线轴 , y 轴是绘图区域的左侧边界 ; 一定要确定两个概念 , 下图红色矩形框的区域

1.4K2 0

腾讯TMQ在线沙龙回顾|UI自动化中阶思考与实践

答：在拉起测试任务的进程前，先使用uiautomator拉起一个watcher进程去监控安装弹框，这个进程监控界面上弹出的安装、信任这些东西，统一都点掉。...12、我们项目的发现webview中webElement的click不生效。只好获取绝对坐标，然后点击屏幕的绝对左边。使用的appium。有其他解决建议吗？答：有以下两种值得一试的方案。‍...1、找到相邻控件坐标，计算当前控件的绝对坐标。如下图： ? uiautomatorviewer中点击右上角警告小三角，会得到有一些元素（黄色控件），是可能无法找到的。...而使用相对坐标就是说，我们可以获取它相邻控件的坐标，然后减去或加上一个比较小的px值，再点击计算后的坐标即可。 2、使用屏幕尺寸计算相对位置。...在测试开始，将屏幕尺寸存下来，使用百分比的方式计算得到需要点击的位置。如下： ? 点击【50%宽度，80%高度】的位置。 13、QQDriver 这个有相关资料吗，关于如何搭建的？

1.5K9 0

关于Shape 的两个问题

01 Shape reference frame and bounding box 形状有一个参考系和一个边界框，每个对象都有。...坐标系或坐标系总是位于形状的几何中心，表示形状的位置和方向是从哪里计算出来的。坐标系有三个轴:x轴、y轴和z轴，分别对应红色、绿色和蓝色箭头。...当点击这个项目时(之前必须选择一个形状)，坐标框将被计算出来，以产生一个边界与世界参考坐标系轴线对齐的边界框(即绝对坐标系)。...显示的边将取决于指定的角度。如果勾选了隐藏边界，那么共享不超过一个三角形的边将被隐藏。 Backface culling（背面剔除）:构成形状的每个三角形都有一个内面和一个外面。...这是特别有用的像使用“污垢”一样的无缝纹理（我理解成做旧），以使物体看起来更真实。 Clear textures (selection)（清除纹理(选择)）:从所有选择的形状中移除纹理。

9001 0

深入浅出理解Faster R-CNN

我们的第一想法是训练一个返回值有8个的网络：这8个值分别是两个物体边界框的左上角坐标右下角坐标。...这个方法显然存在一些问题，比如当物体是不同大小有不同的宽高比，那训练一个效果很好的检测模型将会是非常复杂的（复杂的原因有两个，一个是如果整个图片很大，那么预测出的边界框坐标的绝对值变化很大，不容易拟合；...我们使用第一部分返回的feature map进行输入，以全卷积的方式实现RPN。...对于边界框回归层，我们输出4个预测值：也就是前面我们提到anchor的偏移值通过最后调整好的边界框坐标以及他们的物体分类得分（仅仅粗分是否为物体），我们现在有一组可能含有物体的框。...，那么接下来我们要解决的就是如何利用这些边界框将他们具体分类。

6292 0

理解目标检测模型中的性能评估

本文首先介绍了机器学习中两个比较直观和常用的度量指标：精确度和召回率，然后详细讲解了目标检测领域最常用的度量指标——均值平均精度（mAP），并图解了给定边界框的正确性的度量标准IoU – 交并比。...对于物体检测问题，Ground Truth包括图像，图像中目标的类别以及该图像中每个目标的边界框。一个例子： ?...图显示实际人手工标注的ground truth 我们给了一个真实的图像（JPG，PNG等）和其他标注信息作为文本（边界框坐标（X，Y，宽度和高度）和类），其中上图的红色框和文本标签仅仅是为了更好地理解，...告诉我们一个给定的边界框的正确性的度量标准是IoU – 交并比（检测评价函数），这是一个非常简单的视觉量。有人会说这个名词可以意会，但是我们需要更好的解释。...它不作为量化模型输出的绝对度量，但它是一个相当好的相对度量。当我们在流行的公共数据集上计算这个度量时，这个度量可以很容易地用来比较不同目标检测方法。

3.1K5 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭