我正在从事光学字符识别检测工作,并使用this code.实现了tesseract光学字符识别
但我听说过google docs API,它将提供服务。
但是根据这个link,api只会保存到google docs?
是否有人在您的应用程序中实现或使用了此功能,我可以从哪里获得此API的一些用法示例?
发布于 2020-11-09 18:05:06
现在,我正在使用Google Vision API在我的应用程序中进行OCR。这很简单。您在https://cloud.google.com/vision/本身就有大量的文档。
但是为了回答您的问题,API-response是一个JSON,您可以从中过滤您需要的任何东西,在您的例子中,我假设它是文本。
如下所示:
response = client.text_detection(image= image)
texts = response.text_annotations
print('Texts:')
for text in texts:
print('\n"{}"'.format(text.description))
vertices = (['({},{})'.format(vertex.x, vertex.y)
for vertex in text.bounding_poly.vertices])
print('bounds: {}'.format(','.join(vertices)))
所以基本上你可以对响应做任何你想做的事情。你将不得不做一个帐户,提供帐单信息等一些设置,然后才能使用它。但如果我没记错的话,每月最多有2000张图片是免费的,类似这样。
https://stackoverflow.com/questions/25366294
复制相似问题