使用google cloud API实现pdf文件的OCR

使用Google Cloud API实现PDF文件的OCR（光学字符识别）是一种将PDF文件中的文本内容转换为可编辑文本的技术。以下是完善且全面的答案：

OCR概念： OCR是一种将印刷或手写文本转换为可编辑文本的技术。它通过识别图像中的字符并将其转换为计算机可读的文本形式，使得文本可以被搜索、编辑和分析。

分类： OCR可以分为两类：基于规则的OCR和基于机器学习的OCR。基于规则的OCR使用预定义的规则和模式来识别字符，而基于机器学习的OCR则通过训练模型来自动学习和识别字符。

优势：使用OCR技术可以提高工作效率和准确性，节省人工输入的时间和成本。它可以帮助用户快速提取和处理大量的文本数据，并将其应用于各种场景，如文档管理、数据分析、自动化流程等。

应用场景： OCR技术在各个领域都有广泛的应用，包括但不限于：

文档管理：将纸质文档或扫描的文档转换为可编辑的电子文本，方便存储、检索和共享。
数据分析：从大量的图像或文档中提取关键信息，进行数据挖掘和分析。
自动化流程：将OCR与自动化流程相结合，实现自动化的数据录入、报表生成等任务。
身份验证：通过识别身份证、护照等证件上的信息，实现自动化的身份验证过程。

推荐的腾讯云相关产品和产品介绍链接地址：腾讯云提供了一系列与OCR相关的产品和服务，其中包括：

腾讯云OCR：提供多种OCR功能，包括身份证识别、银行卡识别、车牌识别等。详情请参考：https://cloud.tencent.com/product/ocr
腾讯云文档识别：提供高精度的文档识别服务，支持PDF、图片等多种格式。详情请参考：https://cloud.tencent.com/product/ocr/document-ocr

请注意，以上推荐的腾讯云产品和服务仅供参考，其他云计算品牌商也提供类似的OCR功能和服务。

google-cloud-vision如何读取pdf文件

我正在使用谷歌OCR API，我正在阅读图像和PDF文件，我能够读取和处理图像文件，但是，对于PDF文件，根据，他们已经提到，我们需要将我们的文档存储到谷歌云服务。话虽如此，由于数据的保密性，我不能将我的数据存储到Google Cloud中，我想从我的本地系统上传我的PDF，以便从PDF文件中读取文本。是否可以从本地磁盘上传PDF，然后进行处理，而不是将文件上传到Google Cloud？

浏览 7提问于2018-08-24得票数 6

1回答

使用google cloud API实现pdf文件的OCR

、、

我想使用google API来OCR pdf，但是在下面的语法中我得到了400个错误。我现在该怎么办？ str_json_data = { "requests": [ { "inputConfig": { "content" : "20001008.pdf", "mimeType" : "application/pdf"

浏览 16提问于2019-03-02得票数 0

2回答

用于PDF的GoogleCloudVision API能输出到PubSub吗？

、

我使用以下代码在Google云视觉API上请求OCR操作： from google.cloud import vision from google.cloud import storage from google.protobuf import json_format # Supported mime_types are: 'application/pdf' and 'image/tiff' mime_type = 'application/pdf' # How many pages should

浏览 4提问于2020-02-14得票数 0

1回答

如何使用Google的Vision API将PDF (不可搜索的)转换为可搜索的PDF？

、、、

据我所见，Google的Vision API允许您在PDF上执行OCR，但它只返回JSON格式的检测到的文本。我需要的是一个可搜索(OCR的) PDF文件作为回报。这个是可能的吗？

浏览 4提问于2020-07-26得票数 3

回答已采纳

1回答

google cloud vision 403权限被拒绝错误(其他问题不起作用)

、、

我正在尝试使用google cloud vision API对pdf文档执行OCR，我将pdf文档上传到云存储桶中，并下载oauth密钥文件并将其添加到脚本中，如下所示。但是当我运行这个文件时，我得到了许可: 403错误，有人能给我关于如何修复它的说明吗，我做了大量的谷歌搜索，没有任何结果，我肯定在这里遗漏了什么。 #authenitcation file os.environ"GOOGLE_APPLICATION_CREDENTIALS"="mykeylocation/key1.json“ #method being called opera

浏览 6提问于2018-05-05得票数 0

1回答

Google Cloud Vision API -它可以离线运行吗？

、、

我正在开发一个项目，使用OCR来检测医疗报告中的文本。医疗报告包含敏感数据，需要在我们的系统中离线执行OCR，而不是发送到google服务器在云中执行OCR。这样就可以使用Google Cloud Vision API了吗？

浏览 46提问于2020-08-08得票数 0

1回答

IOS上的Google Cloud Platform OCR

、、、、

因为iOS上的Google Cloud Platform愿景目前只支持人脸识别。在iOS上使用google cloud platform api光学字符识别(OCR)是另一种方式吗？谨致问候, 大卫

浏览 5提问于2017-05-25得票数 0

1回答

上传pdf文件与gdata docs python v3.0与ocr

、、、、

我已经获得了以下用于将pdf文件上传到google docs的实现(取自gdata API示例)： def UploadResourceSample(): """Upload a document, and convert to Google Docs.""" client = CreateClient() doc = gdata.docs.data.Resource(type='document', title='My Sample Doc') # This is a convenient MS

浏览 0提问于2011-12-31得票数 2

回答已采纳

1回答

如何在Firebase Google cloud OCR文本识别中检测人民币符号？

、

我正在使用Firebase Google云文本识别OCR。我在扫描文本和货币。在这种情况下，我可以很容易地扫描文本，但是，一些符号，如日元，元是没有检测到的。我正在使用应用程序中的firebase google cloud ocr API服务扫描文本。

浏览 2提问于2019-06-07得票数 0

1回答

Google不返回任何文档的textStyle和字体信息

、、、

我正在使用文档AI服务OCR扫描和机器生成的PDF文档.我已经用10个不同的文档进行了测试，但没有一个文档带有textStyle属性(总是为空的)。只是想确定这个特性是否真的被支持和工作，或者在文档中提到只是为了展示。 textStyle信息对于我们的业务用例来说是非常关键的。因此，最早的回应将是非常感谢的。我使用默认的Google python示例代码。 from google.api_core.client_options import ClientOptions from google.cloud import documentai_v1 as documentai # TODO(

浏览 11提问于2022-08-05得票数 1

1回答

如何在python程序中使用Google Vision API？

、、

我正在尝试用python运行Google Vision API的最基本的文本检测和OCR (光学字符识别)程序。我的源代码取自此API的Google Cloud教程，如下所示： import io from google.cloud import vision from google.cloud.vision import types def detect_text(file): """Detects text in the file.""" client = vision.ImageAnnotatorClient()

浏览 11提问于2017-12-20得票数 1

2回答

使用google cloud vision识别垂直文本

、

我正在尝试使用google cloud vision来识别垂直文本。图片示例： ? 我在https://cloud.google.com/vision/docs/ocr上使用Try This API来测试引擎。请求正文： { "requests": [ { "features": [ { "type": "DOCUMENT_TEXT_DETECTION" } ], "image": { "

浏览 44提问于2019-03-25得票数 3

回答已采纳

1回答

使用google应用程序脚本(可能还有驱动器API)上传带有OCR的PDF

、、

我正在使用Google Apps脚本从web上传pdf，但我想在自动执行OCR的同时上传它。到目前为止，我可以上传它，但我不知道如何对它执行OCR。 var link = "http://ilwu13.com/dispatches/" ; var date_str = "011813" ; //My code creates this based on today's date var link_end = "_DF.pdf" ; link = link + date_str + linkend ; var ur

浏览 2提问于2013-01-19得票数 1

回答已采纳

2回答

CodeIgniter base_url()用于href，getcwd()用于file_exists()

、

我如何概括或中和base_url()和getcwd()之间的差异？在视图中，我希望同时显示一个内联PDF-查看器(使用<object src=''></object>)和OCR‘’ed输出。这两个文件都需要相同的源文件，该源文件位于project/public/corpus/<some_id>/file.pdf ( project是CodeIgniter根目录)中。控制器中的代码可以概括如下： /** * Fetch the path to the pdf of the document (OCR is preferre

浏览 3提问于2016-10-18得票数 0

回答已采纳

1回答

Laravel:如何将pdf文件直接上传到Google Cloud Storage bucket，而无需先将其保存到本地

、、

我在一个应用程序接口中使用了google/cloud-storage包，并成功地将pdf文件上传到Google Cloud Storage存储桶中。但是，pdf文件在上传到Google Cloud Storage存储桶之前会先保存在本地。如何跳过本地保存，直接上传到Google Cloud Storage存储桶？我计划在Google App Engine上托管API。这是它的post。这就是我目前正在做的事情： $filename = $request['firstname'] . '.pdf'; $fileStoragePath = '/stor

浏览 9提问于2021-04-22得票数 1

回答已采纳

1回答

在使用Google Vision API的DetectText方法时，如何设置超时？我需要一个样本源

、

我想使用Google Vision API的DetectText方法运行OCR。我想为我开发的OCR程序在运行过程中断开连接的情况做好准备。因此，如果在调用DetectText方法后的2秒内没有响应，我想生成一个错误。(默认值为10分钟，设置为600000毫秒)。谢谢你的帮助。在样例源码中会更有帮助。谢谢。 using Google.Cloud.Vision.V1; var image = Google.Cloud.Vision.V1.Image.FromFile(sFilename); var client = ImageAnnotatorClient.Create(

浏览 2提问于2019-04-02得票数 0

1回答

Google Cloud Function Deploying OCR-提取问题

、、、

在我的一个项目中，我一直在使用Google Cloud API OCR tool (https://cloud.google.com/functions/docs/tutorials/ocr)从扫描的图像中提取文本。图像为.png格式。我按照每个说明安装了用于OCR的云API。但是，我在云存储的Input image Bucket中上传图片时，在result Bucket中没有看到结果。但是，我注意到，如果我在下面的部署函数中将参数作为"fr“或"es”传递，结果确实会显示在result Bucket中。我在结果存储桶中看不到"TO_LANG=en“参数的任何结果。

浏览 29提问于2020-08-20得票数 0

回答已采纳

3回答

google-cloud-vision会存储上传的图片吗？这方面的隐私政策是什么？

、

我想在我的项目中实现OCR的google-cloud-vision API。但是由于合规性问题，我需要知道google-cloud-vision是否会存储上传的图像？如果是，对此有什么隐私政策？有没有人有关于这方面的信息？谢谢!

浏览 5提问于2016-04-11得票数 6

1回答

Google驱动器索引大型文件的限制是什么？

、

我使用谷歌驱动api来存储和检索pdf文件。我想使用搜索参数查询这些文件。但在我开始实施之前。我想知道google如何处理大型pdf文件的索引。(600+pages 25Mb+)我想知道基于文本的pdf。(他们不需要ocr) 我尝试了一些搜索驱动器网站，但它并不总是有效的。我想知道这些是否有任何限制，以及它们是什么。

浏览 2提问于2012-08-28得票数 8

2回答

将PDF转换为Google文档，并将提取的文本连同原始PDF文件链接到电子表格中。

、

当我运行一个脚本，用OCR将PDF文件转换为Google文档，然后将结果填充到google表中时，我在获取PDF文件链接方面遇到了一个小问题。到目前为止，我得到了创建的文件的名称(Google )和提取的文本。我想要实现的是:在第3列中，我想获得与创建的Google文档对应的PDF文件的链接我尝试将变量pdf包含到推送数组中： var pdf = document.getId(); ... output.push([name, body, pdf]); 但我对所有文件都有相同的身份。理想情况下，我希望获得PDF文件的完整链接，而不仅仅是ID，以避免使用以下内容创建列： =

浏览 0提问于2019-12-09得票数 0

回答已采纳

1回答

Google Vision检测文本是否保留格式信息？

、

我正在使用Google Vision API从旧报纸中提取数据。我想从每份报纸的最后一页提取性能数据。当我使用Google Drive的OCR时，格式信息被保留(即粗体和斜体)，但当我查看Google Vision创建的json时，我看不到任何格式信息。async_detect_document(gcs_source_uri，gcs_destination_uri)函数中是否有保留格式的选项？下面是pdf和Google Drive渲染的示例。正如您将从示例中看到的，格式化信息是查找每场演出的剧场、作品、作者和演员的快捷方式。 Original PDF of Newspaper Google

浏览 14提问于2020-09-14得票数 0

1回答

Google读取PDF文件，确认为text/html

、、、

您知道如何读取PDF文件吗?哪个mimetype是text/html？我尝试了下面的代码片段，但是OCR不起作用，导致了"API对drive.files.insert的调用失败了:不支持文本/html类型的文件“ function extractTextFromPDF(pdfID) { // PDF File URL // You can also pull PDFs from Google Drive var url = "https://drive.google.com/file/d/"+pdfID var blo

浏览 8提问于2022-03-23得票数 2

回答已采纳

2回答

是否支持从具有梳状字段的pdf/图像中读取手写或打印文本？

我试图从具有梳状字段的表单中读取手写或打字文本，如下图所示。我尝试使用Cloud来读取PDF和手写OCR (带有DOCUMENT_TEXT_DETECTION/TEXT_DETECTION )，但它没有返回正确的数据。字段分隔符(X)正在读取，所以，Google是否支持从具有梳状字段的pdf/图像中读取手写或键入文本？或者，在阅读课文之前，是否可以将字母之间的管道模糊或移除？

浏览 0提问于2019-01-02得票数 0

回答已采纳

2回答

如何在uipath中使用google文本读取pdf

我在uipath是新的，我使用PDF活动来读取与Google的Pdf文本，因为我想得到包含图像的pdf文本。首先，我只使用Pdf文本，它工作得很好。然后，我使用Pdf与OCR，然后它显示了这个错误。但是当我运行它时，它给出了一个错误：- "Google OCR : Error performing OCR: TessErrorLoadEngine" Please help me to read the Pdf file.

浏览 9提问于2017-09-11得票数 0

1回答

使用Google Vision API进行表格识别

我使用Google Vision API的OCR function (DOCUMENT_TEXT_DETECTION)来处理不同的医疗文档。里面有一些表格。根据谷歌的文档，有一个特殊的表格BlockType (https://cloud.google.com/vision/docs/reference/rpc/google.cloud.vision.v1#blocktype)，然而，即使在明显存在表格的情况下，我也不能在谷歌的响应中获得这种块。有没有人知道这种行为的原因？我是否需要使用特殊的选项或方法来使用Google Vision API来检测表？下面是我尝试处理的一个表的示例： ?

浏览 45提问于2021-10-14得票数 2

回答已采纳

2回答

GCP OCR服务-将扫描的PDF或图像转换为可搜索的PDF

、

是否可以使用Google平台的OCR将扫描的PDF转换为新的可搜索PDF文件？

浏览 2提问于2018-01-24得票数 0

1回答

Cloud Vision API有没有办法像AWS Textract一样，将键值对作为响应返回？

、

需要一种以键值格式访问OCR数据的方法。Google Cloud Vision API有没有办法像AWS Textract一样，将键值对作为响应返回？我们目前正在返回边界坐标，但这在我们正在处理的场景中并没有真正的帮助。想知道是否有我们可能忽略的OOB或简单配置设置？在官方文档中找不到这方面的任何相关帮助。提前谢谢。

浏览 23提问于2021-09-24得票数 1

1回答

Cloud Vision:凭证问题

、、

我正在尝试在我的本地机器上的Firebase项目中设置Cloud Vision，但我遇到了默认凭据的问题。首先，我遇到了Could not load the default credentials。这个建议我做gcloud auth application-default login。在尝试的时候，我遇到了这样的情况： Error: 7 PERMISSION_DENIED: Your application has authenticated using end user credentials from the Google Cloud SDK or Google Cloud Shell

浏览 14提问于2020-05-05得票数 0

2回答

如何使Google在我上传的PDF上执行OCR？

、

我有一个PDF，这是一本书的几页扫描。我希望能够在这个PDF中搜索特定的条款。我知道OCR可以在Google的文件上执行。然而，我似乎无法手动启动，我上传的PDF似乎没有可选择的文本(我甚至无法从Google的搜索栏中搜索其中的短语)。有办法“强迫OCR”吗？

浏览 0提问于2017-11-11得票数 2

1回答

我想使用google cloud的PDF/TIFF文档文本检测服务

Google cloud vision api非常强大，现在他们支持pdf格式，但文档让我感到困惑，有人能指导新手如何使用vision api设置和处理pdf文件吗？有点像入门教程参考：令人困惑的是如何传递命令参数，如何发送我的示例文件并以csv或json格式检索结果我应该在google cloud上使用windows命令行还是cloudshell？对于其他服务，有很好的入门参考，如果你看一下这个，他们清楚地给出了在不同环境中使用的命令

浏览 0提问于2018-10-03得票数 0

1回答

检查是否已从Word/Google Docs导出PDF

、、、

我正在做一些OCRing PDF的工作，我很好奇是否有一种方法可以检查一个PDF是否已经从Word (或Google Docs)导出。我可以检查PDF是否已经用Xpdf的pdffonts进行了OCR。我知道Word和Google Docs会自动OCR导出的PDF，所以如果我发现PDF没有OCR，我就知道它没有导出。但是，如果它已经光学字符识别，有没有办法检查的PDF是否从Word/Google Docs导出，而不是简单的OCRd与类似的程序？具体地说，我使用的是JavaScript，但任何信息都是有用的。

浏览 2提问于2013-06-14得票数 0

1回答

google cloud vision api OCR边界框

、、、、

我使用了google cloud vision api。我只想识别图像的某些部分以及通过坐标输入进行ocr分析。(如果我在图像中找到坐标) 谷歌的例子不是这样的。有可能吗？

浏览 13提问于2019-10-24得票数 1

2回答

使用Google Cloud Vision的OCR PDF文件？

、、、

目前是否有任何服务或软件工具使用Google Cloud Vision作为OCRing扫描的PDF文件的后端？如果没有，如何使用Google Cloud Vision将PDF转换为OCRed PDF？据我所知，Cloud Vision目前支持PDF文件，但它只能将识别的文本输出为JSON文件。因此，似乎需要在Google Cloud Vision之外的另一个步骤中，将这个转换后的文本放在PDF中的图像顶部。背景：我经常需要将扫描的文档转换为包含OCRed文本层的PDF文件。到目前为止，我一直在使用像OCRKit或ABBYY FineReader这样的软件。我测试了这些解决方案的准确性与G

浏览 0提问于2018-09-15得票数 4

0回答

Google Drive的OCR的后端实现是什么？

我正在使用Google Drive的API从PDF文件中提取文本。有谁知道用来做这个的工具是不是tessaract？在我开始使用它之前，我想知道它的后端是什么。我所指的呼叫可以在OCR下找到。谢谢你的帮忙!

浏览 10提问于2017-01-14得票数 0

回答已采纳

1回答

是否有方法将文件AI OCR响应解析为pdf格式？

我将扫描的PDF文件传递到Google文档AI OCR中。JSON响应(或者在使用Python时返回的文档对象)以结构化格式包含PDF的内容，正如所描述的。我也希望能够输出一个PDF文件(或者XML，如果更简单的话)。有这样的功能吗？任何关于可能的实现的提示都是非常感谢的。注意:在我执行任务之前，PDF已经是另一个工具的OCRed了，但是质量不如文件AI OCR那么好。谢谢

浏览 1提问于2021-04-07得票数 0

回答已采纳

1回答

如何将Google-Cloud-Vision OCR协议响应保存/加载到磁盘？

、、、

我正在尝试将来自Google-Cloud-Vision OCR的响应保存到磁盘上，发现disk并存储实际的协议是最节省空间的选项，以便以后处理。这部分很简单！现在，我如何从磁盘检索并解析回它的原始格式？我的问题是:在哪里/如何重新构建message_pb2文件，以便将文件解析回protobuf 下面是我到目前为止的documentation代码： #!/usr/bin/python3 # coding: utf-8 from google.cloud import vision import gzip, os, io def ocr_document(path): "

浏览 16提问于2019-04-11得票数 4

1回答

Firebase云函数& Cloud Vision接口: TypeError: vision.detectText不是函数

、、、

我尝试在Firebase Cloud function中使用Cloud Vision API来OCR存储在Firebase Storage中的图像。我导入Google Cloud vision客户端库，如下所示 const vision = require('@google-cloud/vision'); 然后我会打电话给 vision.detectText({ source: { imageUri: 'gs://xxxx.appspot.com/yyyy.JPG' } }) 但是，我得到了一个错误 TypeError: vision.detectText不

浏览 3提问于2017-12-23得票数 2

回答已采纳

1回答

如何将google vision API响应保存为可处理文件

、、

我正在尝试从一些票证中提取google cloud vision OCR API提供给我的所有信息。我可以将文本保存在.txt中，但是响应response = client.text_detection(image=image)的其余部分我不知道如何保存它。谢谢

浏览 9提问于2020-09-23得票数 1

回答已采纳

1回答

使用Google脚本从多页附件PDF中提取文本

、、、、

我有一个Gmail附件PDF与多个扫描页面。当我使用Google脚本将blob从附件保存到驱动器文件时，从Google手动打开PDF，然后选择，PDF中的所有文本都显示为Google。但是，当我将blob保存为带有OCR的Google时，只有第一个页面上的图像中的文本被保存到Doc中，可以手动访问，也可以通过代码访问。获取blob并处理它的代码如下： function getAttachments(desiredLabel, processedLabel, emailQuery){ // Find emails var threads = GmailApp.search(em

浏览 8提问于2020-07-02得票数 0

回答已采纳

2回答

如何通过API网关将AWS Lambda中的"pdf“和"html”文件作为“事件”传递？

、、、

我试图将"pdf“或"html”文件直接传递到lambda函数中。但是我不明白它应该以什么正确的格式接收？我能够理解如何使用以下代码通过lambda函数传递“图像”文件:但是如何发送pdf或html文件呢？ def write_to_file(save_path, data): with open(save_path, "wb") as f: f.write(base64.b64decode(data)) def ocr(img): ocr_text = pytesseract.image_to_string(img, config = &#

浏览 1提问于2020-05-06得票数 0

回答已采纳

2回答

为什么Google Cloud Vision api无法检测特定pdf文件中的文本，尽管它在非常相似的pdf文件上运行良好？

、、、

google cloud vision api在一个pdf pdf1上运行良好，但在另一个pdf pdf2上完全不返回任何内容。我无法理解这种行为，因为这两个pdf非常相似，并且具有几乎相同的font.Please帮助。我使用了示例部分中给出的代码，将这些文件上传到google云存储桶中。 def async_detect_document(gcs_source_uri, gcs_destination_uri): """OCR with PDF/TIFF as source files on GCS""" from goog

浏览 25提问于2019-05-20得票数 2

1回答

google.api_core.exceptions.InternalServerError: 500未能处理所有文档

、、、

当我试图在python中实现google中的文档OCR时，我遇到了这个错误，如下所述：。当我跑的时候 operation.result(timeout=None) 我知道这个错误 Traceback (most recent call last): File "<input>", line 1, in <module> File "/Users/Niolo/Desktop/project/venv/lib/python3.8/site-packages/google/api_core/future/polling.py&

浏览 2提问于2021-03-04得票数 1

回答已采纳

1回答

ImportError:运行脚本时无法导入名称'google‘

、

我正在尝试使用脚本将文件上传到驱动器。我在python 3.7.9上运行 import os from Google import Create_Service from googleapiclient.http import MediaFileUpload CLIENT_SECRET_FILE = 'google-auth.json' API_NAME = 'drive' API_VERSION = 'v3' SCOPES = ['https://www.googleapis.com/auth/drive'] FILE = &

浏览 5提问于2021-07-08得票数 0

1回答

Google Cloud Translate API PDF文件

、、、

我希望使用Google Cloud Translate API构建一个服务。我已经注册了高级版，只需要弄清楚如何使用NODEjs上传PDF文件。我找不到任何关于如何将文件上传到API的文档。谢谢!

浏览 0提问于2017-01-30得票数 0

1回答

将Google中的所有PNG图像转换为文本(OCR)

、、、

我发现Google是波斯语文本中最好的OCR。问题是Google不能转换大于2MB的文件，所以我不能使用大PDF。因此，我将PDF中的所有页面提取到PNG图像中。现在，我如何告诉Google将特定文件夹中的所有PNG转换为Google文档？

浏览 0提问于2017-08-22得票数 3

回答已采纳

1回答

如何使用python的类型模块？

、

我正在尝试使用他们的python API运行OCRmypdf。当我没有声明语言时，我可以运行它。然而，当我试图声明一种语言时，它抛出了一个错误。api.py文件使用类型来声明language: List[str] = None，所以我从类型中导入了List，并尝试声明一个lang变量，这抛出了一个错误。我的代码： source = 'fr'; target = 'en'; tess_lang = 'fr' x: List[str] = ['eng', 'fr'] for dirpath, dirs, files

浏览 15提问于2019-12-31得票数 0

回答已采纳

1回答

错误: documentTextDetection不是一个函数

只需跟随得到错误时，运行到第3行 const vision = require('@google-cloud/vision'); const ocr = new vision.ImageAnnotatorClient(); const [r] = ocr.documentTextDetection(file.path); const fullText = r.fullTextAnnotation; documentTextDetection不是一个函数好的，请调用.textDetection() Environment details OS: Win 10 Node

浏览 0提问于2019-08-24得票数 0

1回答

Google Cloud Vision OCR错误代码7-权限被拒绝

、、

我正在构建一个使用Google Cloud Vision的OCR的OCR应用程序。对于大约7-8个请求，OCR工作得很好，之后我得到一个错误，如下所示： Error: 7 PERMISSION_DENIED: Your application has authenticated using end user credentials from the Google Cloud SDK or Google Cloud Shell which are not supported by the vision.googleapis.com. We recommend configuring the bi

浏览 14提问于2020-03-15得票数 1

回答已采纳

1回答

谷歌云存储支持OCR？

、、

Google Cloud Storage有一个搜索机制来使用OCR (光学字符识别)来查找图像文件吗？例如，有可能在谷歌云存储中搜索图像文件文档，按其内容？就像在Google Drive里一样。

浏览 0提问于2015-06-27得票数 0

1回答

使用指定图像的base64字符串从响应400

、、

我读过，但一点帮助都没有。对我来说是不可取的，因为我正在做许多图像处理(例如旋转、裁剪、调整大小等)。在OCR之前和期间。将它们作为新文件保存，并作为Google的输入重新读取它们，效率相当低。因此，我直接检查了投递请求的文档：，以下是造成故障的最低限度代码： import base64 import requests import io # Read the image file and transform it into a base64 string with io.open("photos/foo.jpg", 'rb')

浏览 0提问于2018-04-19得票数 4

回答已采纳