开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

如何从图像中裁剪出检测到的对象(圆)并将其存储？

从图像中裁剪出检测到的对象（圆）并将其存储，可以通过以下步骤实现：

图像检测：使用计算机视觉技术，如目标检测算法，来检测图像中的圆对象。常用的目标检测算法包括基于深度学习的方法，如Faster R-CNN、YOLO等。
圆对象裁剪：一旦检测到圆对象的位置，可以根据检测结果在图像中裁剪出圆对象。裁剪可以通过提取圆的边界框或使用图像分割算法来实现。
存储裁剪后的对象：将裁剪后的圆对象存储到合适的存储介质中，如本地磁盘、云存储等。存储时可以考虑使用适当的图像格式，如JPEG、PNG等。

推荐的腾讯云相关产品和产品介绍链接地址：

图像识别与处理：腾讯云图像识别服务（https://cloud.tencent.com/product/imagerecognition）
云存储服务：腾讯云对象存储（https://cloud.tencent.com/product/cos）
人工智能服务：腾讯云人工智能（https://cloud.tencent.com/product/ai）

以上是一个简单的解决方案，具体实现还需要根据具体需求和技术选型进行调整。

相关搜索:如何使用OpenCV从图像(拍摄目标)中裁剪出最大的圆如何从对象数组中检索选择性属性，并使用javascript将其存储为对象？如何从对象中获取图像并将其放入react native中的元素中？如何从JSON格式的多个对象中获取值并将其存储在数组中？如何从对象中的所有键中获取特定值并将其存储在数组中？如何读取CSV文件，过滤特定的记录，并根据记录将其存储在不同的java对象中。如何从对象中嵌套的数组中提取值并将其存储在不同的数组中JAVASCRIPT 如何从完整路径中获取文件名并将其存储在Javascript的对象属性中？如何从json对象中提取特定字段并将其存储在node.js中的字符串中如何获取从android设备上传的文本文件，并使用django将其存储在文件夹中？

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

SilhoNet：一种用于3D对象位姿估计和抓取规划的RGB方法

论文题目：SilhoNet:An RGB Method for 3D Object Pose Estimation and Grasp Planning

01

基于 Jetson 在 Aerial 系统内进行深度学习

无人驾驶空中系统（UAS）在过去十年中被广泛应用，尽管 UAS 最早被应用在军事上，事实证明，它们在很多其它领域都是有用的，包括农业、地理制图、航空摄影、搜索和救援等。然而这些系统都需要一个人循环完成远程控制、场景识别和数据获取。这不仅增加了操作成本，而且将应用范围极大程度上限制在了能够进行远程控制的应用范围内。

01

基于OpenCV 的车牌识别

车牌识别是一种图像处理技术，用于识别不同车辆。这项技术被广泛用于各种安全检测中。现在让我一起基于OpenCV编写Python代码来完成这一任务。

04

玩王者荣耀用不好英雄？两阶段算法帮你精准推荐精彩视频

【导读】近日，腾讯三位工程师在arXiv上发表了论文，分析如何利用算法，针对热门手游“王者荣耀”游戏视频进行快速检测与识别，辨识视频中的角色（即“英雄”），以推荐视频给目标受众。为了提取游戏视频标签，需要在游戏视频中检测并识别其中的英雄及其阵营。本文提出了一种有效的两阶段算法，基于血条模板匹配方法检测视频中的所有英雄，再根据阵营分类，然后使用一个或多个深度卷积神经网络识别英雄姓名。实验证明了方法的效率与准确性。

01

当一个程序员决定穿上粉色裤子

这个想法在我脑海中不停地闪现，始终没有遇到特别合适的契机进行实践。直到最近，我遇到了一个名为 Fashion AI 的项目，它主要利用微调模型对服装图片进行分割（segmentation），然后裁剪出图像中标注（label）的时尚单品，并将所有图片调整为相同的大小，最后将这些图像转化为 embedding 向量存储在开源向量数据库 Milvus 中。通过这个项目可以在 Milvus 数据库中查询并获得 3 个最相似的向量结果。随后，就可以通过上传一张自己穿着打扮的照片，最终确定与我们时尚风格最为相似的明星。

04

实战｜TF Lite 让树莓派记下你的美丽笑颜

我们很高兴展示借助 TensorFlow Lite 在 Raspberry Pi 上构建 Smart Photo Booth 应用的经验（我们尚未开放源代码）。该应用可以捕捉笑脸并自动进行记录。此外，您还可以使用语音命令进行交互。简而言之，借助 Tensorflow Lite 框架，我们构建出可实时轻松处理笑脸检测和识别语音命令的应用。

01

实战：使用 OpenCV 和 PyTesseract 对文档进行OCR

随着世界各地的组织都希望将其运营数字化，将物理文档转换为数字格式是非常常见的。这通常通过光学字符识别 (OCR) 完成，其中文本图像（扫描的物理文档）通过几种成熟的文本识别算法之一转换为机器文本。当在干净的背景下处理打印文本时，文档 OCR 的性能最佳，具有一致的段落和字体大小。

02

数据分享|Python卷积神经网络CNN身份识别图像处理在疫情防控下口罩识别、人脸识别

我们运用Python 3.8.1版本，爬取网络数据，基于卷积神经网络（CNN）的图像处理原理，搭建口罩识别技术训练集，构建人脸识别系统，最终建立高校师生行踪查询管理系统。

02

1024x1024 分辨率，效果惊人！InsetGAN：全身图像生成 (CVPR 2022)

该论文是出自于CVPR2022关于GAN的最新文章。要知道虽然目前GAN可以在某些领域的理想条件下能够生成逼真的图像，但由于发型、服装和姿势的多样性，生成全身人体图像仍然很困难，之前的方法一般是用单个GAN对这个复杂域进行建模。

04

如何用YOLO+Tesseract实现定制OCR系统？

在本文中，你将学习如何在深度学习的帮助下制作自己自定义的 OCR 来读取图像中的文字内容。我将通过 PAN-Card 图像的示例，带你学习如何进行文本检测和文本识别。但首先，让我们熟悉一下光学字符识别的过程。

02

如何用YOLO+Tesseract实现定制OCR系统？

我们的第一个任务是从图像/文档中检测所需的文本。通常，根据需要，你不想阅读整个文档，而只想阅读一条信息，如信用卡号、Aadhaar/PAN 卡号、姓名、账单金额和日期等。检测所需文本是一项艰巨的任务，但由于深度学习，我们将能够有选择地从图像中读取文本。

01

6个步骤，告诉你如何用树莓派和机器学习DIY一个车牌识别器！（附详细分析）

几个月前，作者开始考虑让汽车能够具备检测和识别物体的能力。他很喜欢这个主意，因为已经见识到了特斯拉的能力，并且虽然不能立即购买特斯拉（Model 3看起来越来越有吸引力了），但他认为会尽力实现自己的梦想。

02

停车位检测新数据集、新方法，精准又快速（含视频解读）

论文地址：https://arxiv.org/pdf/2005.05528.pdf

03

停车位检测新数据集、新方法，精准又快速

论文地址：https://arxiv.org/pdf/2005.05528.pdf

02

黑白照片修复亦可「如假包换」，华人学者提出实例感知着色新方法

给黑白图像自动上色一直是个很有趣的话题，这方面的技术可广泛应用于旧照片和旧视频的修复，使百年旧照重新焕发生机。我们也会经常看到一些黑白照片修复成品，即使是上个世纪早期的旧照片，经过着色以后效果也十分惊艳。

01

前端 + AI —— 走进无码时代

导语：前端智能化，就是通过AI/CV技术，使前端工具链具备理解能力，进而辅助开发提升研发效率，比如实现基于设计稿智能布局和组件智能识别等。

03

YOLT: 大尺寸图像目标检测的解决方案

前几天听人聊到了这个YOLT，本着长见识的目的稍微看了看，然后打算在这里给没看到的人做一个科普，希望这里面的几个Tricks可以对你有所启发。YOLT论文全称「You Only Look Twice: Rapid Multi-Scale Object Detection In Satellite Imagery」，是专为卫星图像目标检测而设计的一个检测器，是在YOLOV2的基础上进行改进的。论文原文和代码实现见附录。

02

基于FPGA的数字识别-实时视频处理的定点卷积神经网络实现

因为之前写的系列文章反应不是特别好，所以还是决定把一些复杂的东西简单化（尽量不写系列文章了），所以本篇文章将会完成所有的内容。

02

立体相机开发|几何感知的实例分割

http://www-scf.usc.edu/~choyingw/works/GAIS-Net/WSAD/CVPRW_CameraReady.pdf

02

ECCV18 | 如何正确使用样本扩充改进目标检测性能（附Github地址）

众所周知，在计算机视觉识别任务中，对训练样本进行增广是非常重要的，可以减少过拟合、改进模型泛化性能。

02

老婆问「我今天穿什么合适」？让AI来帮你想答案吧

这个问题很难回答，因为第一我对时尚无感，而 Yumi 则刚好相反，她拥有一个时装设计学位。第二，我记不住过去几周她穿过什么衣服，所以没法提供多样化的答案。

04

TCSVT 2024 | 位置感知的屏幕文本内容编码

主流编码标准采用划分树结构实现块级预测和变换。以 HEVC 为例，它将图像分割成固定尺寸且互不重叠的 CTU，每个 CTU 能够进一步细分为更小的编码单元 CU 和预测单元 PU。这种结构下的候选划分模式和位置是预先设定好的，这意味着 CTU 或 CU 的边界并不总是与文本字符的边界重合，进而导致字符在像素层面的完整性受到破坏。特别是在字符跨越 CTU 边界的情况下，会出现大量小尺寸的 CU，造成预测效率下降以及不必要的比特率消耗，如下图所示。

01

使用Python+OpenCV进行数据增广方法综述（附代码演练）

数据扩充是一种增加数据集多样性的技术，无需收集更多的真实数据，但仍然有助于提高模型的准确性和防止模型过度拟合。在这篇文章中，你将学习使用Python和OpenCV实现最流行和最有效的对象检测任务的数据扩充过程。

02

用YOLOv5和CLIP做了一个找图神器，搜图、裁剪一步到位，在线可试用

关注并星标从此不迷路计算机视觉研究院公众号ID｜ComputerVisionGzq 学习群｜扫码在主页获取加入方式计算机视觉研究院专栏作者：Edison_G ---- 给 Crop-CLIP 一个口令，就能自动搜图，还能帮忙裁剪出图片中的关键部分。 ---- 转自《机器之心》经常找图的人都知道，根据检索关键词组寻找理想中的照片是件很麻烦的事情。打开搜索引擎或无版权图片网站，输入关键词，如果幸运的话，可能会在第一页或前 N 个检索结果中找到想要的图像。这种搜索方式仍然是基于图片标签进行的。

03

使用SSD进行目标检测：目标检测第二篇

【导读】近日，CV-Tricks.com发布了一篇文章，使用SSD进行目标检测，SSD是当前最流行的目标检测算法之一。作者从检测的基本概念、滑动窗口检测、减少滑动窗口方法的冗余计算、修改后网络的训练方

05

使用 Python 和 OpenCV 进行数据增广

数据扩充是一种增加数据集多样性的技术，无需收集更多真实数据，但仍有助于提高模型精度并防止模型过度拟合。在这篇文章中，我们将学习使用 Python 和 OpenCV 为对象检测任务实现最流行和最有效的数据扩充过程。

06

day2-Machine Learning Yearning图片上传失败，请查看原文：https://github.com/iOSDevLog/100-days-of-ai/blob/master/r

假设您的系统是使用复杂的机器学习流水线构建的, 并且您希望提高系统的性能。你应该在哪些方面努力改进？通过将错误归因于流水线的特定组件, 您可以决定如何排定工作的优先级。

01

[BOT] 一种android中实现“圆角矩形”的方法

内容简介文章介绍ImageView（方法也可以应用到其它View）圆角矩形（包括圆形）的一种实现方式，四个角可以分别指定为圆角。思路是利用“Xfermode + Path”来进行Bitmap的裁剪。

07

DIY自动分类“错题集”：一种基于视觉词汇的文本分类法

作者：曹阳敏万达网络科技 | 资深研发经理量子位已获授权编辑发布转载请联系原作者一年多以前我脑子一热，想做一款移动应用：一款给学生朋友用的“错题集”应用，可以将错题拍照，记录图像的同时，还能自动分类。比如拍个题目，应用会把它自动分类为”物理/力学/曲线运动”。当然，这个项目其实不靠谱，市场上已经有太多“搜题”类应用了。但过程很有趣，导致我过了一年多，清理磁盘垃圾时，还舍不得删掉这个项目的“成果”，所以干脆回收利用一下，写篇文章圈圈粉。源码地址： https://github.com/caoym

05

多图文帖智能封面提取方案

导语一个帖子在用户点进去观看之前，能被用户捕捉到的信息只有封面缩略图、标题、作者等少量信息，这些因素直接决定了用户是否愿意点击该帖。一个好的封面能明显提高用户的点击欲，而对于不少UGC内容的帖子，用户也不会去指定封面，这时智能提取封面就显得尤为重要。对于资讯类App，从文章的配图中选择1-3张图片并裁剪出适合区域作为封面，是一种很常见的场景。这里会涉及到两个问题：如何从多张图片中选择质量较高的前几张图作为封面？挑选出来的图片宽高比可能与封面要求的比例不符，如何从图中裁剪出适合的区域呈现给用户？本

03

21个项目玩转深度学习学习笔记（2）

事实上，必须先读入数据后才能进行计算，假设读入用时0.1s，计算用时0.9秒，那么没过1s，GPU都会有0.1s无事可做，大大降低了运算的效率。

01

基于 opencv 的人脸识别系统

随着智能设备的不断发展，人脸检测技术应用于越来越多的领域，极大的丰富和方便了人们的生活，具有很大的商业价值和研究意义。人脸识别主要为两个步骤：人脸检测（FaceDetection）和人脸识别（Face Recogniton）。人脸检测就是判断待检测图像中是否存在人脸以及人脸在图片中的位置，人脸识别则是将检测到的人脸与已知的人脸库中的人脸进行比对，得出相似度信息。本项目基于天嵌的 TQ2440（采用 S3C2440 处理器）硬件开发平台，扩展 USB 摄像头模块，搭建配置嵌入式开发环境，给出并实现了一个嵌入式人脸识别实现方案。本系统使用人脸类 harr 特征、Adaboost 算法进行人脸检测，采用 PCA（Principal Component Analysis）降维算法得到特征脸子空间，将在 PC 平台训练的人脸识别分类器预存到嵌入式目标平台，最后结合最近邻匹配算法实现在线人脸识别，实际采集的图片测试结果表明该系统效果良好。

02

我的妻子总问我她今天该穿什么，于是我用AI做了这样一款时尚应用

我妻子几乎每天都会问这个问题：我今天该穿什么？这是一个很难回答的问题，因为首先我没有时尚感，而 Yumi 恰恰相反，她有时装设计学位。其次，我记性不好，我想不起来她过去几周穿了什么衣服，回答可能千篇一律。

03

【CV 向】如何打造一个“数串串神器“

之前吃串串火锅，老板数竹签不是称重就是用手慢慢数，但是称重似乎总是得不到正确的竹签数目，而且容易暗箱操作；而慢慢数总是要等待比较长的时间，感觉两者对处理数竹签的问题都存在比较大的缺陷。因此，一款可以数竹签的应用因此产生，一下就弥补了两种处理方式所存在的缺陷。

02

【CV 向】如何打造一个“数串串神器“

之前吃串串火锅，老板数竹签不是称重就是用手慢慢数，但是称重似乎总是得不到正确的竹签数目，而且容易暗箱操作；而慢慢数总是要等待比较长的时间，感觉两者对处理数竹签的问题都存在比较大的缺陷。因此，一款可以数竹签的应用因此产生，一下就弥补了两种处理方式所存在的缺陷。

01

技术分享：人脸识别究竟是如何完成的？

随着人工智能的高速发展，基于计算机视觉技术研究及应用也逐渐进入成熟阶段。其中，人脸识别是运用较多的一种技术，已经渗透到人类日常生活的方方面面。

00

深度 | 级联MobileNet-V2实现人脸关键点检测（附训练源码）

机器之心投稿作者：余霆嵩为了能在移动端进行实时的人脸关键点检测，本实验采用最新的轻量化模型——MobileNet-V2 作为基础模型，在 CelebA 数据上，进行两级的级联 MobileNet-V2 实现人脸关键点检测。首先，将 CelebA 数据作为第一级 MobileNet-V2 的输入，经第一级 MobileNet-V2 得到粗略的关键点位置；然后，依据第一级 MobileNet-V2 的输出，采取一定的裁剪策略，将人脸区域从原始数据上裁剪出来作为第二级 MobileNet-V2 的输入；最后，

05

小智周末学习发现了 10 个好用JavaScript图像处理库

用 JavaScript 处理图像可能非常困难且繁琐。幸运的是，有许多库可以让这些变得简单得多。下面介绍一些图像处理的库。

01

车道和障碍物检测用于驾驶期间的主动辅助

虽然已经有半自动驾驶汽车在世界各地运行。这篇文章探讨了将移动计算平台用作ADAS副驾驶的程度。

05

检测技术再进化：人物交互检测，基于多层次条件网络的方法（ICMR2020）

https://dl.acm.org/doi/abs/10.1145/3372278.3390671

03

OpenCV 安卓编程示例：1~6 全

在本章中，我将逐步介绍如何开始使用 OpenCV 开发具有视觉感知的 Android 应用。

01

使用CoreML和ARKit进行人脸检测和识别

现在已经拥有了自己的项目，并且因为不喜欢使用故事板，所以应用程序以编程方式完成，这意味着没有按钮或开关切换，只需要纯粹的代码。

02

UI进阶13 Quartz2DQuartz2D

Quartz2D 什么是Quartz2D Quartz 2D是一个二维绘图引擎，同时支持iOS和Mac系统 Quartz 2D能完成的工作绘制图形 : 线条\三角形\矩形\圆\弧等绘制文字绘制\生成图片(图像) 读取\生成PDF 截图\裁剪图片自定义UI控件 … … Quartz2D实例 Quartz 2D能做很多强大的事情,例如裁剪图片涂鸦\画板手势解锁报表：折线图\饼状图\柱状图 Quartz2D在iOS开发中的价值为了便于搭建美观的UI界面，iOS提供了UIKit框架，里面

03

吴恩达《ML Yearning》| 端到端的深度学习

MachineLearning YearningSharing 是北京科技大学“机器学习研讨小组”旗下的文献翻译项目，其原文由Deep Learning.ai 公司的吴恩达博士进行撰写。本部分文献翻译工作旨在研讨小组内部交流，内容原创为吴恩达博士，学习小组成员只对文献内容进行翻译，对于翻译有误的部分，欢迎大家提出。欢迎大家一起努力学习、提高，共同进步！

01

「知识型图像问答」微调也没用？谷歌发布搜索系统AVIS：少样本超越有监督PALI，准确率提升三倍

在大型语言模型（LLM）的加持下，与视觉结合的多模态任务，如图像描述、视觉问答（VQA）和开放词汇目标识别（open-vocabulary object detection）等都取得了重大进展。

01

ECCV 2020 oral | CondInst：沈春华团队新作，将条件卷积引入实例分割

论文地址：https://arxiv.org/pdf/2003.05664.pdf

04

行人被遮挡问题怎么破？百度提出PGFA新方法，发布Occluded-DukeMTMC大型数据集 | ICCV 2019

【导语】在以人搜人的场景中，行人会经常被各种物体遮挡。之前的行人再识别（re-id）方法要么忽略了此问题，要么是基于极端假设来解决该问题。为了解决遮挡问题，作者提出检测遮挡区域，并在特征生成和匹配过程中去排除那些遮挡区域。

01

人体姿态识别有了PaddlePaddle实现，它是否会成为下一个AI宠儿？

随着深度学习技术的发展，人体骨骼关键点的检测效果也在不断提升，且被广泛应用于计算机视觉相关领域，成为许多计算机视觉任务的基础，包括安防，新零售，动作捕捉，人机交互等等。现在，大火的人体姿态识别也有了PaddlePaddle的实现。我们来带小伙伴们学习一下怎么利用PaddlePaddle来实现人体姿态的识别任务。

03

基于OpenCV的视频处理管道

目前可依靠模块化方式实现图像处理管道，检测一堆图像文件中的人脸，并将其与漂亮的结构化JSON摘要文件一起保存在单独的文件夹中。

02

谷歌开源基于 ML 的手部跟踪算法：手机端实时检测，多个手势同时捕捉

就在不久前，Google 人工智能实验室宣布，他们在「实时手部跟踪」方面取得了新的进展，并将这项新技术运用在了 MediaPipe 中，这也是 AI 计算机视觉任务的一大突破。这一技术不光可以在手机上实现实时捕捉性能，甚至可以同时对多个手的动作进行跟踪。目前，Google 已经将该项目开源，并且发布了相关博客介绍了这项技术，AI 开发者将其内容整理编译如下。

03

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭