首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何使用CustomVision接口返回边界框的绝对坐标?

CustomVision是微软提供的一个自定义视觉服务,它允许用户训练自定义图像分类器和对象检测模型。在使用CustomVision接口时,返回的边界框(Bounding Box)坐标通常是相对于图像尺寸的归一化坐标,范围在0到1之间。要获取边界框的绝对坐标,你需要将这些归一化坐标转换为图像的实际像素坐标。

以下是获取边界框绝对坐标的步骤:

  1. 获取归一化坐标: 当你调用CustomVision的API来检测图像中的对象时,返回的结果中会包含边界框的归一化坐标。这些坐标通常表示为left, top, width, height,其中lefttop是边界框左上角的归一化坐标,widthheight是边界框的宽度和高度。
  2. 获取图像尺寸: 你需要知道图像的实际宽度和高度(以像素为单位),这可以通过图像处理库或者直接从图像文件中获取。
  3. 计算绝对坐标: 使用以下公式将归一化坐标转换为绝对坐标:
  4. 计算绝对坐标: 使用以下公式将归一化坐标转换为绝对坐标:
  5. 这样,left_absolute, top_absolute, right_absolute, bottom_absolute就是边界框的绝对坐标。
  6. 应用场景: 获取边界框的绝对坐标对于多种应用场景都是必要的,例如在图像上绘制边界框、裁剪图像中的对象、或者在视频流中实时跟踪对象等。
  7. 可能遇到的问题及解决方法
    • 如果归一化坐标超出了0到1的范围,可能是由于模型训练或预测时的错误导致的。需要检查模型的训练数据和预测代码。
    • 如果图像尺寸获取不正确,可能会导致计算出的绝对坐标错误。确保使用的是正确的图像尺寸。
    • 在处理大量数据时,性能可能成为一个问题。可以考虑优化代码或者使用更高效的数据处理方法。

请注意,以上代码示例仅供参考,实际应用中可能需要根据具体情况进行调整。如果你在使用CustomVision接口时遇到具体问题,可以参考微软官方文档或者在Stack Overflow等社区寻求帮助。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

如何使用php调用api接口,获得返回json字符的指定字段数据

如何使用php调用api接口,获得返回json字符的指定字段数据 今天试着用php调用远程接口,获取调用接口后的数据,将其记录下来,方便日后调用。...开始调用 逻辑: 先合并出需要调用的接口以及参数 然后用php中file_get_contents()函数,获取接口返回的所有内容。...最后再通过json_decode,将获取到的内容进行json解码,然后进行输出,得到想要的结果。(这里调用接口,获得百度域名的备案主体的信息)。...下面是输出的结果: 下面是直接访问上方接口返回的内容 最后,将上面的示例代码放出来。 需要的可以免登录,下方评论拿走即可! 本文共 220 个字数,平均阅读时长 ≈ 1分钟

8.4K30

tf.image.non_max_suppression

删除与先前选择的框具有高交叉-过度联合(IOU)重叠的框。...边界框以[y1, x1, y2, x2]的形式提供,其中(y1, x1)和(y2, x2)为任意对角对角框角的坐标,坐标可以标准化(即,位于区间[0,1]或绝对区间。...注意,这个算法不知道原点在坐标系中的什么位置。注意,这个算法对于坐标系的正交变换和平移是不变的;因此,坐标系统的平移或反射会导致算法选择相同的框。...这个操作的输出是一组整数,索引到表示所选框的边界框的输入集合中。然后使用tf可以获得与所选索引对应的边界框坐标。收集操作。例如:selected_indices = tf.image。...返回值:selected_indices:形状[M]的一维整数张量,表示从box张量中选择的指标,其中M <= max_output_size。

1.5K20
  • 使用OpenCV搭建违章停车检测系统

    感兴趣区域的选择如下图所示 现在,我们有了感兴趣的区域或禁止车辆停放的地方的像素的所有坐标点。然后我们选取车辆的边界框坐标(如何识别车辆呢,可以参考小白之前的文章)。但是,这又带来了一个问题。...如果相机离这个感兴趣区域太近,当有车辆接近该区域时,它的边界框会占据非常多的坐标点,当同时有车辆时,必须对视频的每一帧重复这个过程,导致帧率急剧下降。...此外,当该条件为真时,将会有关于边界框的前一帧日志详细信息获取到另一个名为previous_bbox_co_str的变量中。 现在我们知道了车辆在当前帧和前一帧的边界框坐标。...previous_bbox_co_str作为函数的属性,以及当前的边界框坐标。...需要注意,即使车辆或任何物体完全停止,YOLO 也会给出波动的边界框坐标。为避免这个现象并使此过程稳健,我们在此处将判定变量设置为比较高的值。该值越高,程序对边界框的随机波动就越鲁棒。

    46830

    比较目标检测模型性能的统计量,了解一下?

    一个例子 我们给定了真实图片(jpg, png 等格式)和其他解释性文字(边界框的坐标( x, y,宽度和高度)和类别),画在图片上的红色框和文本标签只是方便我们自己观看。...,坐标值大小是估计的) 让我们实际操作一下,看看 mAP 是如何计算的。...我们用模型对原始图像进行处理,下面是目标检测模型在置信度阈值化之后返回的结果。 带有边界框的图像: 来自我们模型的结果 我们可以说这些检测结果是正确的,但是我们怎么量化呢?...这个统计量也叫做 Jaccard 指数(Jaccard Index),是由 Paul Jaccard 在 20 世纪初首次提出的。 要获得交集和并集的值,我们首先把预测边界框覆盖在参考边界框之上。...(如图所示) 现在对于每个类别,预测边界框和参考边界框的重叠部分叫做交集,而两个边界框跨越的所有区域叫做并集。

    94041

    平均精度均值(mAP)——目标检测模型性能统计量

    一个例子   我们给定了真实图片(jpg, png 等格式)和其他解释性文字(边界框的坐标( x, y,宽度和高度)和类别),画在图片上的红色框和文本标签只是方便我们自己观看。 ?...实际图片   以及三组定义了参考标准的数字(让我们假设这张图片的分辨率是 1000 x 800 像素,表中所有坐标的单位都是像素,坐标值大小是估计的) ?   ...我们用模型对原始图像进行处理,下面是目标检测模型在置信度阈值化之后返回的结果。   带有边界框的图像: ? 来自我们模型的结果   我们可以说这些检测结果是正确的,但是我们怎么量化呢?   ...这个统计量也叫做 Jaccard 指数(Jaccard Index),是由 Paul Jaccard 在 20 世纪初首次提出的。   要获得交集和并集的值,我们首先把预测边界框覆盖在参考边界框之上。...(如图所示)   现在对于每个类别,预测边界框和参考边界框的重叠部分叫做交集,而两个边界框跨越的所有区域叫做并集。 ?

    1.6K20

    Hands On GUI Application Development in Go

    ,也就完成了界面元素的创建;但此时的界面元素是孤独的,与其他界面元素没有形成联系(没有父母,没有兄弟姐妹) 界面元素如何被管理 新创建的界面元素纳入管理的过程,就是为其添加父母,兄弟姐妹的过程。...使用的函数接口为connect();从此该界面元素会跟其他界面元素一样,纳入一棵树中,并随之响应用户可能的点击操作。...没法发生变化,将返回NULL snap_shot 生成当前显示的快照,并输出到bitmap文件。...left:surface指定区域的左边界坐标;top:surface指定区域的上边界坐标;right:surface指定区域的右边界坐标;bottom:surface指定区域的下边界坐标 is_valid...rect:用于输出位置信息 get_screen_rect 获取自己(this)相对于UI系统的绝对位置信息。

    1.1K10

    1小时快速搭建基于Azure Custom Vision和树莓派的鸟类分类和识别应用

    我们这里就使用门户的方式上传。具体步骤如下: 在自定义视觉门户中创建项目:转到 https://www.customvision.ai/projects 并登录。...窗格中的“正在训练...” 通知指示正在进行训练。 训练完成时,将显示有关如何为正在训练的迭代执行模型的信息。...在“如何使用预测 API”的“如果你有一个图像 URL”下的文本框中,复制并保存该值,然后选择“获取”。 ?...树莓派应用构建 树莓派中,我们要使用到custom vision的python SDK,所以我们要使用pip工具安装以下库: 1 pip3 install azure-cognitiveservices-vision-customvision...14所示,图中我们可以看到,返回的结果里面,将识别的鸟类用红色框进行了标注。

    1.1K20

    原创 | 一文读懂多模态强化学习

    在利用交叉注意力层对输入提示进行编码过程中,冻结预训练语言模型和解码机器人动作命令, VIMA采用以物体为中心的表示,从边界框坐标和裁剪的RGB补丁中计算标记。...对于文本输入,使用预训练的T5标记器和词嵌入来获取单词标记;对于完整桌面场景的图像,首先使用域微调的Mask R-CNN 提取出单个物体。将每个物体表示为装订框和裁剪的图像。...然后,通过使用边界框编码器和ViT 分别对其进行编码来计算出物体标记。...由于Mask R-CNN的不完美性,物体的边界框可能会有噪声,裁剪的图像可能具有不相关的像素;对于单个物体的图像,以相同的方式获取标记,使用虚拟边界框。...边界框的格式为 xcenter, ycenter, height, width(横坐标中心,纵坐标中心,高度和宽度),将每个维度值除以上边界的坐标值之后,对边界框格式值进行归一化,使其在[0,1] 之间

    69610

    手把手教你使用PyTorch从零实现YOLOv3(1)

    解释输出 通常,(与所有目标检测器一样)将卷积层学习到的特征传递到分类器/回归器上,该分类器/回归器进行检测预测(边界框的坐标,类标签等)。 在YOLO中,通过使用1 x 1卷积的卷积层来完成预测。...B表示每个单元格可以预测的边界框的数量。根据本文,这些B边界框中的每一个都可以专门用于检测某种对象。每个边界框都有5+C属性,这些属性描述每个边界框的中心坐标,尺寸,置信度得分和C类置信度。...做出预测 以下公式描述了如何转换网络输出以获得边界框预测。 ? YOLO方程 bx,by,bw,bh是我们预测的x,y中心坐标,宽度和高度。tx,ty,tw,th是网络输出的内容。...通常,YOLO不会预测边界框中心的绝对坐标。它预测的偏移量是: 相对于预测对象的网格单元的左上角。 通过特征图中的像元尺寸进行归一化,即1。 例如,考虑我们的狗的形象。...现在在步幅为16的层上进行另一次检测。重复相同的上采样过程,并在步幅8的层上进行最终检测。 在每个尺度上,每个像元使用3个锚来预测3个边界框,使使用的锚总数为9。(不同尺度的锚是不同的) ?

    3.6K11

    Avalonia中的线性渐变画刷LinearGradientBrush

    坐标系统与边界框无关。...坐标系统是相对于边界框的:0表示边界框的0%,1表示边界框的100%。例如,(0.5,0.5)描述边界框中间的一个点,(1,1)描述边界框右下角的一个点。...于是可以确定是Polygon的使用上不对,根据Polygon的填充色#377af5,我猜测跟Polygon的坐标有关,调整Polygon的位置后填充色会发生变化,于是修改Polygon的坐标,结果得到了想要的渐变色三角形...由于相对模式的坐标系统是基于本地空间,这样并没有解决Points="240 19 240 40 220 19"的Polygon实现渐变效果的需求,继而需要寻求绝对值模式的解决方式。...归纳了以下几点内容: Avalonia中线性渐变画刷既支持相对模式,也支持绝对模式。 StartPoint和EndPoint的取值为百分比时使用的相对模式,取值为数值则是绝对模式。

    26110

    超详细的Java容器、面板及四大布局管理器应用讲解!

    实现一个带有滚动条的文本框。...绝对布局管理器 除了网格布局管理器、流布局管理器、边界布局管理器这三种布局方式以外,还有一种较为不同的布局方式就是绝对布局,所谓绝对布局,就是按照一定的坐标数据将组件的坐标和大小硬性的设置在窗体上。...:“盘点Java窗体中关于默认布局管理器容易踩的坑” 之后再使用以下方法对组件进行绝对定位: setBounds(x,y,width,height); //其中x表示组件基于容器左上角的横坐标、y表示纵坐标..., 200, 30); //为组件设置绝对坐标 container.add(jb3); //将组件添加到容器 setLayout(null); //清空布局管理器,即取消原来的边界布局管理器...在使用绝对布局管理器时值得注意的就是:在使用绝对布局之前要调用setLayout(null)方法来告知编辑器,这里将不再使用默认的布局管理器。

    2.9K10

    ECharts入门(一)基础概念概览

    所以,一个 系列 包含的要素至少有:一组数值、图表类型(series.type)、以及其他的关于这些数据如何映射成图的参数。 echarts 里系列类型(series.type)就是图表类型。...)、polar(极坐标系底板)、geo(地理坐标系)、dataZoom(数据区缩放组件)、visualMap(视觉映射组件)、tooltip(提示框组件)、toolbox(工具栏组件)、series(系列...这种绝对定位的方式,类似于 CSS 的绝对定位(position: absolute)。绝对定位基于的是 echarts 容器 DOM 节点。...其中,他们每个值都可以是: 绝对数值(例如 bottom: 54 表示:距离 echarts 容器底边界 54 像素)。...或者基于 echarts 容器高宽的百分比(例如 right: '20%' 表示:距离 echarts 容器右边界的距离是 echarts 容器宽度的 20%)。

    1.2K10

    自动驾驶汽车的伪激光雷达-双目立体视觉

    计算机视觉领域在过去的十年里得到了迅猛的发展,特别是在障碍物检测方面。障碍物检测算法,如YOLO或RetinaNet提供了二维边界框,用边界框给出了障碍物在图像中的位置。...为了能够返回每个障碍物的距离,工程师们将相机与激光雷达(LiDAR,光探测和测距)传感器进行融合,后者使用激光来返回深度信息。将计算机视觉信息和激光雷达输出进行传感器的融合。...,看看我们如何使用双目立体视觉来估计物体的深度。...对于每个障碍物,该算法将返回一个包含4个数字的边界框:[x1;y1;x2;y2]。这些数字表示框的左上点和右下点的坐标。假设我们在左边的图像上运行这个算法,并且使用左边的深度图。...如下图在这个边界框中,我们可以取最近的点。知道这一点后,可以通过深度图知道了图像中每个点的距离,而且边界框中的第一个点也就是相机到障碍物的距离。

    1.3K30

    CAD复习资料

    在打开的“选择线型”的对话框中单击“加载”按钮,打开“加载或重载线型”对话框。在该对话框中的可用线型中选择所需的线型。然后返回“选择线型”对话框。...    ⑹返回“图层特性管理器”对话框,单机【确定】按钮,确认调用图层状态。...46、AutoCAD2004点坐标的几种表示方法:绝对坐标,相对坐标,绝对极坐标,相对极坐标。 47、如何理解图块及其属性,如何创建带有属性的块?...坐标的表示方法 四种坐标的定义 1)      绝对坐标 是以原点(0,0,0)为基点来定义所有的点的方法 (x,y,z) 2)      相对坐标 是相对于某点的相对位置 (@x,y) 3)     ...绝对极坐标 是相对于坐标原点的距离和角度来定义任意一点的位置的 默认的角度是逆时针方向来测量角度的 水平向右是起始方向 200<0 4)      相对极坐标 是相对于某点的极长距离和角度定义点的位置,

    6.4K01

    从零开始学Pytorch(十七)之目标检测基础

    如果该目标的真实边界框已知,这里的“较好”该如何量化呢?一种直观的方法是衡量锚框和真实边界框之间的相似度。我们知道,Jaccard系数(Jaccard index)可以衡量两个集合的相似度。...那么,该如何为锚框分配与其相似的真实边界框呢?...我们看到,返回的结果的形状为(批量大小, 锚框个数, 6)。其中每一行的6个元素代表同一个预测边界框的输出信息。...剩余的4个元素分别是预测边界框左上角的 x 和 y 轴坐标以及右下角的 x 和 y 轴坐标(值域在0到1之间)。...因此,当使用较小锚框来检测较小目标时,我们可以采样较多的区域;而当使用较大锚框来检测较大目标时,我们可以采样较少的区域。 为了演示如何多尺度生成锚框,我们先读取一张图像。

    1.1K30

    【Android 应用开发】Canvas 精准绘制文字 ( 测量文本真实边界 | 将文本中心点与给定中心点对齐 )

    * * 在边界内返回(由调用方分配)包含所有字符的最小矩形,其隐含原点为(0,0)。...* * @param text 测量的字符串并返回其边界 * @param start 要测量字符串的起始位置 * @param end 要测量字符串的结束位置 + 1...* @param bounds 返回所有文本的联合边界。...是使用 Paint 在 Canvas 中绘制的文本的真实占用区域 , 如下图红色矩形框所在的区域 , 与文本的相对坐标 , 下图的红色矩形框的 右下角是 ( 0 , 0 ) 坐标位置 ; Rect 中获取的坐标值示例..., bottom = 0 , 说明文本的底部就是基线 ; 上述 Rect 的坐标轴是这么算的 , x 轴是文本的基线轴 , y 轴是绘图区域的左侧边界 ; 一定要确定两个概念 , 下图 红色矩形框 的区域

    1.4K20

    腾讯TMQ在线沙龙回顾|UI自动化中阶思考与实践

    答:在拉起测试任务的进程前,先使用uiautomator拉起一个watcher进程去监控安装弹框,这个进程监控界面上弹出的安装、信任这些东西,统一都点掉。...12、我们项目的 发现webview中webElement的click不生效。只好获取绝对坐标,然后点击屏幕的绝对左边。使用的appium。有其他解决建议吗? 答:有以下两种值得一试的方案。‍...1、找到相邻控件坐标,计算当前控件的绝对坐标。如下图: ? uiautomatorviewer中点击右上角警告小三角,会得到有一些元素(黄色控件),是可能无法找到的。...而使用相对坐标就是说,我们可以获取它相邻控件的坐标,然后减去或加上一个比较小的px值,再点击计算后的坐标即可。 2、使用屏幕尺寸计算相对位置。...在测试开始,将屏幕尺寸存下来,使用百分比的方式计算得到需要点击的位置。如下: ? 点击【50%宽度,80%高度】的位置。 13、QQDriver 这个有相关资料吗,关于如何搭建的?

    1.5K90

    关于Shape 的两个问题

    01 Shape reference frame and bounding box 形状有一个参考系和一个边界框,每个对象都有。...坐标系或坐标系总是位于形状的几何中心,表示形状的位置和方向是从哪里计算出来的。坐标系有三个轴:x轴、y轴和z轴,分别对应红色、绿色和蓝色箭头。...当点击这个项目时(之前必须选择一个形状),坐标框将被计算出来,以产生一个边界与世界参考坐标系轴线对齐的边界框(即绝对坐标系)。...显示的边将取决于指定的角度。如果勾选了隐藏边界,那么共享不超过一个三角形的边将被隐藏。 Backface culling(背面剔除):构成形状的每个三角形都有一个内面和一个外面。...这是特别有用的像使用“污垢”一样的无缝纹理(我理解成做旧),以使物体看起来更真实。 Clear textures (selection)(清除纹理(选择)):从所有选择的形状中移除纹理。

    90010

    深入浅出理解Faster R-CNN

    我们的第一想法是训练一个返回值有8个的网络:这8个值分别是两个物体边界框的左上角坐标右下角坐标 。...这个方法显然存在一些问题,比如当物体是不同大小有不同的宽高比,那训练一个效果很好的检测模型将会是非常复杂的(复杂的原因有两个,一个是如果整个图片很大,那么预测出的边界框坐标的绝对值变化很大,不容易拟合;...我们使用第一部分返回的feature map进行输入,以全卷积的方式实现RPN。...对于边界框回归层,我们输出4个预测值:也就是前面我们提到anchor的偏移值 通过最后调整好的边界框坐标以及他们的物体分类得分(仅仅粗分是否为物体),我们现在有一组可能含有物体的框。...,那么接下来我们要解决的就是如何利用这些边界框将他们具体分类。

    62920

    理解目标检测模型中的性能评估

    本文首先介绍了机器学习中两个比较直观和常用的度量指标:精确度和召回率,然后详细讲解了目标检测领域最常用的度量指标——均值平均精度(mAP),并图解了给定边界框的正确性的度量标准IoU – 交并比。...对于物体检测问题,Ground Truth包括图像,图像中目标的类别以及该图像中每个目标的边界框。 一个例子: ?...图显示实际人手工标注的ground truth 我们给了一个真实的图像(JPG,PNG等)和其他标注信息作为文本(边界框坐标(X,Y,宽度和高度)和类),其中上图的红色框和文本标签仅仅是为了更好地理解,...告诉我们一个给定的边界框的正确性的度量标准是IoU – 交并比(检测评价函数), 这是一个非常简单的视觉量。 有人会说这个名词可以意会,但是我们需要更好的解释。...它不作为量化模型输出的绝对度量,但它是一个相当好的相对度量。当我们在流行的公共数据集上计算这个度量时,这个度量可以很容易地用来比较不同目标检测方法。

    3.1K50
    领券