用Pytesseract / OpenCV绘制边界框

Pytesseract是一个基于Python的OCR（光学字符识别）库，它利用Tesseract OCR引擎来识别图像中的文本。OpenCV是一个广泛用于计算机视觉任务的开源计算机视觉库。

绘制边界框是一种在图像中标记出文本或对象的常见技术，它可以用于提高识别结果的可视化效果或用于定位特定区域。

以下是使用Pytesseract和OpenCV绘制边界框的基本步骤：

导入所需的库：

import cv2
import pytesseract

加载图像：

image = cv2.imread('image.jpg')

对图像进行预处理（可选）：根据具体图像情况，可以应用一些预处理技术来改善图像的质量，例如灰度化、二值化、去噪等。例如，将图像转换为灰度图像：

gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

使用Pytesseract进行文本识别：

text = pytesseract.image_to_string(image)

使用OpenCV绘制边界框：

# 获取识别出的文本的边界框坐标
boxes = pytesseract.image_to_boxes(image)

# 在图像上绘制边界框
for box in boxes.splitlines():
    box = box.split(' ')
    x, y, w, h = int(box[1]), int(box[2]), int(box[3]), int(box[4])
    cv2.rectangle(image, (x, y), (w, h), (0, 255, 0), 2)

展示或保存结果：

cv2.imshow('Image with Bounding Boxes', image)
cv2.waitKey(0)
cv2.destroyAllWindows()

这样，我们就可以使用Pytesseract和OpenCV绘制出图像中文本的边界框。

推荐腾讯云的相关产品和产品介绍链接地址：

腾讯云OCR：提供强大的OCR技术，可用于实现文字识别功能。
腾讯云图像处理：提供图像处理相关服务，包括图像识别、智能裁剪、美颜等功能。

请注意，以上推荐的产品仅为示例，并非对其他云计算品牌商的评论或比较。

相关·内容

opencv: 绘制矩形轮廓框，并记录轮廓框坐标

步骤简述使用OpenCV绘制矩形轮廓框，一般包括如下步骤：转换为灰度图；进行阈值处理；进行中值滤波；在原始图像上绘制矩形框。...附图解析原始图像：第一步，转换为灰度图：第二步，经过阈值处理：第三步，中值滤波后：最后一步，在原始图像上绘制矩形框：生成的记录文件（矩形轮廓框四个端点的平面坐标.../origin.jpg') # 文档路径，用于记录轮廓框坐标 txt_file = open('....得到的轮廓列表 _1, contours, _2 = cv2.findContours(pic, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE) # 根据轮廓列表，循环在原始图像上绘制矩形边界

3.5K3 0

教程 | Adrian小哥教程：如何使用Tesseract和OpenCV执行OCR和文本识别

首先，我们使用 OpenCV 的 EAST 文本检测器来检测图像中的文本。EAST 文本检测器将提供文本 ROI 的边界框坐标。...最后，我们将在输出图像上绘制 OpenCV OCR 结果。过程中使用到的 Tesseract 命令必须在 pytesseract 库下调用。...实现我们的 OpenCV OCR 算法现在开始用 OpenCV 执行文本识别吧！打开 text_recognition.py 文件，插入下列代码： ?...注意：完美情况下，旋转的边界框也在 rects 内，但是提取旋转边界框不利于解释本教程的概念。因此，我计算了水平的边界框矩形（把 angle 考虑在内）。...基于 ROI 绘制 ROI 周围的边界框和结果文本（第 173-176 行）。展示输出，等待即将按下的键（第 179、180 行）。

3.9K5 0

基于OpenCV的表格文本内容提取

PyTesseract是一种光学字符识别（OCR），该库提了供文本图像。 PyTesseract确实有一定的效果，用PyTesseract来检测短文本时，结果相当不错。...图1.直接使用PyTesseract检测表中的文本图1描绘了文本检测结果，绿色框包围了检测到的单词。可以看出算法对于大部分文本都无法检测，尤其是数字。...返回的第二个参数将用于绘制ROI的边界框文字提取现在，我们定义了ROI功能。我们可以继续提取结果。我们可以通过遍历单元格来读取列中的所有数据。列数由关键字的长度指定，而行数则由定义。...首先，让我们定义一个函数来绘制文本和周围的框，并定义另一个函数来提取文本。...import pytesseract pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files (x86)\Tesseract-OCR\tesseract.exe

2.6K2 0

【Rust日报】2022-02-14 Rust 和 OpenCV

Rust 和 OpenCV 这是一篇 OpenCV 在 Rust 中的使用指导, 非常的详尽....原文链接: https://jonte-osterberg.medium.com/rust-and-opencv-bb0467bf35ff Rust 编写的 Flappybird 这是一个 Rust 编写的...为Rust带来所有相关的命令行tesseract功能基于tesseract的Python包装器(即https://github.com/madmaze/pytesseract) 允许测试一个预先训练的...tesseract模型，并以不同的格式输出结果，如字符串、边界框、字典或数据帧。...github地址: https://github.com/thomasgruebl/rusty-tesseract ctv: 高度可配置的树视图可视化命令行工具 ctv 是一个用 Rust 编写的高度可配置的树视图可视化命令行工具

5043 0

使用 OpenCV 和 Tesseract 对图像中的感兴趣区域 (ROI) 进行 OCR

这篇文章基于 Python 3.x，假设我们已经安装了 Pytesseract 和 OpenCV。Pytesseract 是一个 Python 包装库，它使用 Tesseract 引擎进行 OCR。...现在，使用 opencv 的 imread() 方法将图像文件读入 python。...不用担心，OpenCV 只需几行代码即可为我们完成这项工作！...########################################################################################### 感兴趣区域的边界框...现在，使用 pytesseract 在 ROI 上应用光学字符识别 (OCR)。

1.6K5 0

实战：使用 OpenCV 和 PyTesseract 对文档进行OCR

最重要的包是用于计算机视觉操作的OpenCV和PyTesseract，它是强大的 Tesseract OCR 引擎的 Python 包装器。...images\Passport.png',0) img_copy = img.copy() img_canny = cv2.Canny(img_copy, 50, 100, apertureSize = 3) OpenCV...img_canny, 1, math.pi / 180, 100, minLineLength = 100, maxLineGap = 10) 接下来，我们在边缘检测图像上使用另一种称为霍夫变换的算法，通过检测线绘制出护照区域的形状...因此，使用 OpenCV 的矩形函数，我们可以在区域周围绘制一个框来验证我们的尺寸选择。 ?...根据你们的用例，使用其他方法（例如轮廓分析或对象检测）可能最有效，正如我们的护照练习所示，在应用 OCR 之前对图像进行适当的预处理是关键。

1.9K2 0

关于c#winform用sharpGL(OpenGL)绘制不出图形，绘制窗口是个黑框的坑

aircraft 原文链接：https://www.cnblogs.com/DOMLX/p/11790309.html 在c++的opengl中可能是因为是最基本的库，很多东西都把你做好了转到c#下用大牛们对...使用起来需要非常的严谨就比如： gl.Color(0.0f, 0.0f, 1.0f);这个设置颜色的代码在c++下不管是0.0f也好还是0也好都可以，而在c#下sharpGL没有写0.0f的这种格式图像就完全绘制不出来...还有一个点就是在winfrom下绘制的图形默认是把你们整个窗口都覆盖的你这个窗口的视距就是贴着这个图形的如果你没有加这句： gl.Translate(0.0f, 0.0f, -6.0f);将图形往后移动几个单位...，你在winfrom的界面可能会全是黑的让你觉得你没有绘制出图形出来。。。。...那么如果你出现了其他绘制的问题，自己还觉得代码逻辑没问题的话，仔细检查一下格式。

1.5K1 0

嵌入式图像处理：算法、应用与性能优化

] class_id = np.argmax(scores) confidence = scores[class_id] if confidence > 0.5: # 绘制边界框...下面是一个使用Python的图像识别示例：import cv2import pytesseract# 读取图像image = cv2.imread('image.jpg')# 使用OCR识别文字text...= pytesseract.image_to_string(image)# 输出识别结果print(text)在这个示例中，我们使用了Tesseract OCR库来识别图像中的文字。...')# 使用OCR识别文字text = pytesseract.image_to_string(image)# 输出识别结果print(text)我们使用Tesseract OCR库来识别图像中的文字，...waitKey(1) & 0xFF == ord('q'): breakcap.release()cv2.destroyAllWindows()我们检测摄像头捕获的图像中的运动区域，并用绿色矩形框标记出来

4200 0

基于OpenCV 的车牌识别

现在让我一起基于OpenCV编写Python代码来完成这一任务。车牌识别的相关步骤 1.车牌检测：第一步是从汽车上检测车牌所在位置。我们将使用OpenCV中矩形的轮廓检测来寻找车牌。...有很多方法可以做到，最简单和流行的方法是使用OpenCV中的canny edge方法。...if len(approx) == 4: screenCnt = approx break 找到正确的计数器后，我们将其保存在名为screenCnt的变量中，然后在其周围绘制一个矩形框...就像前面的教程一样，我们将使用pytesseract包从图像读取字符。...完整代码 #@programming_fever import cv2 import imutils import numpy as np import pytesseract pytesseract.pytesseract.tesseract_cmd

7.5K4 1

OpenCV 查找轮廓

本文将结合实例代码，介绍 OpenCV 如何查找轮廓、获取边界框。...模型用的 Mask R-CNN 已有预测边框。但其他模型会有只出预测掩膜的，此时想要边框就可以使用 OpenCV 来提取。...len(contours)): cv.drawContours(drawing, contours_poly, i, (0, 255, 0), 1, cv.LINE_8, hierarchy) 获取边界框...boundingRect 获取边界框，并绘制： for contour in contours_poly: rect = cv.boundingRect(contour) cv.rectangle...minEnclosingCircle 获取边界圈，并绘制： for contour in contours_poly: center, radius = cv.minEnclosingCircle(

8982 0

计算机视觉 OpenCV Android | 基本特征检测之轮廓分析

（1）边界框最常见的获取轮廓的外接矩形是边界框，获取每个轮廓的边界框，通过它可以得到与各个轮廓相对应的高度与宽度，并能通过它计算出轮廓的纵横比。...调用该API会返回一个Rect对象实例，它是OpenCV关于矩形的数据结构，从中可以得到外界矩形（边界框）的宽高，然后就可以计算出轮廓的横纵比了。...这种情况下得到的边界框不一定满足条件，有时候我们还需要获取轮廓的最小边界框。...（2）最小边界框与上面边界框不同的是，获取到的最小边界框有时候不是一个水平或者垂直的矩形，而是一个旋转了一定角度的矩形，但是最小外接矩形（最小边界框）能够更加真实地反映出轮廓的几何结构大小，...，首先需要得到四个顶点，然后通过OpenCV绘制直线的API来完成旋转矩形的绘制。

1.4K2 0

基于OpenCV实战：车牌检测

我们将使用OpenCV（cv2）读取图像。...要将这个想法应用到Python，我们首先将OpenCV findContours函数应用到图4上以查找所有闭合轮廓。...然后，为了可视化它们，我们应用了drawContours函数将轮廓绘制到原始图像上。 ? ? 如图6所示，它具有许多轮廓，其中大多数轮廓形状不正确或没有被认为是矩形的区域。...为此，我们将使用Pytesseract。我们还将需要安装Teseract，并将其与Pytesseract结合使用。 ? 使用“ image_to_string”功能从轮廓提取文本。...OpenCV和Pytesseract在此项目上是众多方法之一。但是有了路线图，它可以使你们更好地了解要采用的方法，以及需要或者想要的项目有多复杂。 — — 完 — —

1.5K2 0

OpenCV Python + Tesseract-OCR轻松实现中文识别

转自|opencv学堂 01 软件版本 - Python3.6.5 - OpenCV-Python 4.x - Tesseract-OCR 5.0.0-alpha.20201127 - Win10 64...安装opencv-python开发包 pip install opencv-python 安装Tesseract-OCR Python SDK支持 pip install pytesseract 下载Tesseract-OCR...打开Pycharm IDE，新建一个python项目与python文件，输入以下代码 import pytesseract as tess print(tess.get_tesseract_version...lang=None, config='', nice=0, output_type=Output.STRING, timeout=0, ) 返回所有识别文字的Box框坐标...，每一行为一个BOX信息输出每行的前五个值分别是，识别的字符、BOX框的左上角与右下角坐标识别 def image_to_string( image, lang=None,

10.1K2 0

使用深度学习的端到端文本OCR

此技术的另一个好处是，它的实现在OpenCV 3.4.2和OpenCV 4中可用。将看到这种EAST模型以及文本识别的实际应用。文字识别一旦检测到包含文本的边界框，下一步就是识别文本。...OpenCV软件包使用EAST模型进行文本检测。tesseract软件包用于识别在为文本检测到的边界框中的文本。确保tesseract版本> =4。在线上有多个资源可指导Tesseract的安装。...从分数和几何图形解码旋转边界框更为复杂。...希望看到图像上的边界框，以及如何从检测到的边界框提取文本。使用Tesseract进行此操作。...但是边界框中的某些文本无法正确识别。根本无法检测到数字。这里存在不均匀的背景，也许生成统一的背景将有助于解决这种情况。另外，盒子中的24边界不正确。在这种情况下，对边界框进行填充可能会有所帮助。

2K2 0

python3光学字符识别模块tesserocr与pytesseract的使用详解

image_to_string　　将图像上的Tesseract OCR运行结果返回到字符串 image_to_boxes　　返回包含已识别字符及其框边界的结果 image_to_data　　返回包含框边界...'), lang='eng')) #获取图像边界框 print(pytesseract.image_to_boxes(Image.open('test.png'))) #获取包含边界框，置信度，行和页码的详细数据...table.append(1) return image.point(table,'1') #自动登陆 def login(): try: driver.get(url) #获取用户输入框...By.CSS_SELECTOR,'#loginname'))) #type:WebElement input.clear() #发送用户名 input.send_keys(user) #获取密码框...password'))) #type:WebElement inpass.clear() #发送密码 inpass.send_keys(password) #获取验证输入框

1.8K2 0

(使用Python 和 OpenCV)

这种经过训练的机器学习算法可以检测图像中是否有人脸，如果检测到人脸，还会放置一个边界框。...是一种机器学习算法，我们用大量图像训练级联函数。...文件 # 加载级联 face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml') 第 3 步：检测人脸并在其周围绘制边界框...使用Haar-cascade 分类器中的detectMultiScale()函数检测人脸并在其周围绘制边界框： # 读取输入图像 img = cv2.imread('test.png') # 检测人脸...faces = face_cascade.detectMultiScale(image = img, scaleFactor = 1.1, minNeighbors = 5) # 在人脸周围绘制边界框

1K2 1

60行代码加速20倍 NEON实现深度学习OD任务后处理绘框

最近在学neon汇编加速，由于此前OD任务发现在检测后处理部分使用OpenCV较为占用资源且耗时，遂尝试使用NEON做后处理绘框，以达到加速并降低CPU资源消耗的目的。...处理上下边框：对于顶部边界，遍历整个第一行的像素，并使用NEON的存储指令将特定颜色值写回到这些位置（比如想绘制的是绿框，那么需要将B通道的绘框元素数据更改为0，G通道为255，R通道为0）。...作为【1】中end2end模型出框后的后处理绘框函数，测试数据为COCO2017 Val数据集，将两个程序用taskset -c先绑定在编号为0的核上，得出两者在处理5000张图的处理速度差异，如下所示...，单图绘框速度越快，从图可以看出，单核运行的NEON绘框的速度依旧稳稳碾压多核并行的OpenCV。...OpenCV绘框效果如下: NEON汇编绘框效果如下: 四、完整代码 void check_point(int *x1, int *x2, int nstride) { int mod, w,

1371 0

YOLOv3使用笔记

其中标签文件中的每一行条目代表图像中的单个边界框，并包含有关该框的以下信息： object-class-id...center-x和center-y分别是边界框中心的 x 和 y 坐标（以像素为单位），分别由图像宽度和高度归一化。...width和height分别是边界框的宽度和高度（以像素为单位），再次分别由图像宽度和高度归一化。...,confidences[idx],box.x,box.y, box.x+box.width,box.y+box.height,frame); } } //绘制预测边界框...void drawPred(int classId,float conf,int left,int top,int right,int bottom,cv::Mat& frame){ //绘制边界框

1.1K2 0

深度学习的端到端文本OCR:使用EAST从自然场景图片中提取文本

文本检测技术需要检测图像中的文本，并在具有文本的图像部分周围创建和包围框。标准的目标检测技术也可以使用。滑动窗口技术可以通过滑动窗口技术在文本周围创建边界框。然而，这是一个计算开销很大的任务。...这种技术的另一个好处是，它的实现可以在OpenCV 3.4.2和OpenCV 4中使用。我们将看到这个EAST模型的应用，以及文本识别。文字识别一旦我们检测到有文本的包围框，下一步就是识别文本。...OpenCV包使用EAST模型进行文本检测。tesseract包用于识别检测到的文本框中的文本。确保tesseract版本>= 4。Tesseract的安装请大家自行百度。...我们如何从检测到的边界框中提取文本？Tesseract可以实现。...但是我们当前的实现不提供旋转边界框。这是由于Tesseract不能完全识别它。 ? 这个模型在这里表现得相当不错。但是有些文本在边界框中不能正确识别。数字1根本无法检测到。

2.5K2 1

使用Python+OpenCV+dlib为人脸生成口罩

这篇文章试图用OpenCV和dlib库来实现这个过程，在这里我们综合生成5种类型的口罩来绘制人脸图像。图1显示了生成的5种口罩类型。...这个库是用C++编程语言创建的，它可以使用C/C++、Python和java等语言。导入库我们从导入所需的库开始：OpenCV、dlib、numpy、os和imutils。...我们将通过某种方法获得面边界框，其中我们分别使用图像中人脸的（x，y）坐标。一旦人脸区域被检测到并被限定，我们进入下一步检测脸部区域中的关键点。...此检测器会进行图像中人脸边界框的检测。检测器的第一个参数是我们的灰度图像。（此方法也适用于彩色图像）。第二个参数是在应用检测器之前对图像进行放大时要应用的图像金字塔层的数量。...我们还打印出边界框的坐标以及检测到的人脸数。我们也可以使用cv2在检测到的面部周围使用for循环绘制边界框。

1.7K1 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云