腾讯云

文章/答案/技术大牛

发布

社区首页 >问答首页 >哪些选项可以改善使用谷歌CLoud视觉的光学字符识别？

问哪些选项可以改善使用谷歌CLoud视觉的光学字符识别？
EN

Stack Overflow用户

提问于 2017-10-01 20:50:10

回答 1查看 323关注 0票数 1

我正在用Google cloud vision测试OCR，我发现结果特别糟糕。我的文档是法语的，但它遗漏了许多撇号和逗号。例如作为输入

使用代码

Request
        .post(`https://vision.googleapis.com/v1/images:annotate?key=AIzaSyAtArxxxxxxxxxxxxxxxxxpGrKrydU4`)
        .send({
          requests: [{
            image: { content: base64.replace('data:image/jpeg;base64,', '') },
            features: [{ type: 'DOCUMENT_TEXT_DETECTION' }],
            "imageContext": { "languageHints": [ "fr" ] }
          }]
        })

我得到了结果(错误以黄色突出显示)

当我用Microsoft Azure OCR测试相同的图像时，结果是绝对完美的，而不需要指明语言。

有没有人在Google Cloud Vision中遇到过类似级别的不准确？

javascript

azure

ocr

google-cloud-vision

回答 1

Stack Overflow用户

发布于 2018-09-04 16:43:21

您可以使用"languageHints": ["fr"]指定它

{
  "requests": [
    {
      "imageContext": {
        "languageHints": ["fr"]
      }
    }
  ]
}

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/46516766

复制

win10 uwp 使用 OCR 光学字符识别

windows 文字识别

在 UWP 里面可以很方便通过 Windows.Media.Ocr.OcrEngine 识别图片的字符，其实老周有写过这一篇技术博客，今天有小伙伴在问如何实现，我还以为老周的博客过时了，于是重新复制老周的代码跑了一次，然后就通过了

林德熙

2020/04/10

1.5K0

【深度学习】光学字符识别（OCR）

图像识别机器学习神经网络深度学习

OCR （Optical Character Recognition，光学字符识别）是指对图片中的文字进行查找、提取、识别的一种技术，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程。

杨丝儿

2022/03/01

6.6K0

SVM算法实现光学字符识别

机器学习神经网络深度学习人工智能编程算法

OCR （Optical Character Recognition，光学字符识别）是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机字符的过程；即，针对印刷体字符，采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件，并通过字符识别模型将图像中的文字处理成文本格式。

不脱发的程序猿

2021/05/08

1K0

【光学字符识别】OCR 浅述

ocr

文字是信息的重要载体之一。通过书写、印刷、电子设备等方式，文字可以被记录下来并传递给他人。文字也是语言的重要组成部分，人们可以通过文字来表达自己的思想、感情和意图。在信息化时代，文字仍然是最基本、最重要的信息传递方式之一，也有着其不可替代的优势，如：简短明了、方便快捷、易于编辑、可归纳整理等。

青橙.

2023/08/25

7600

OCR光学字符识别方法汇总

机器学习神经网络人工智能文字识别编程算法

文本是人类最重要的信息来源之一，自然场景中充满了形形色色的文字符号。光学字符识别（OCR）相信大家都不陌生，就是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程。

小白学视觉

2022/04/06

1.8K0

OCR Tool PRO Mac(OCR光学字符识别)

文字识别爬虫 iphone ios

Mac知识分享

2022/08/29

16.3K0

【OCR技术系列一】光学字符识别技术介绍

其他

注：此篇内容主要是综合整理了光学字符识别和OCR技术系列之一】字符识别技术总览，详情见文末参考文献

闪电gogogo

2018/08/10

5.9K0

微软为SkyDrive加入OCR光学字符识别功能

文字识别 windows

OCR技术的中文译名为光学字符识别，该技术能够将图片中的文字提取为可编辑的文字。虽然时至今日技术仍不成熟，但在大多数情况下已经能够代替人工独立作业。而微软更是早在office 2003就加入了OCR功能。近日，微软为旗下SkyDrive存储服务增加了OCR识别功能，能够对相机胶圈中的照片进行自动OCR识别。

reizhi

2022/09/26

1.1K0

【说站】python OpenCV中的光学字符识别介绍

文字识别图像处理 python opencv

OCR表面上看起来很简单。虽然计算机视觉领域已经存在了50多年，但研究人员还没有创建出高度准确的通用OCR系统，仍然有很长的路要走。

很酷的站长

2022/11/24

5100

计算机视觉最新进展概览(2021年5月16日到2021年5月22日)

api 图像识别机器学习神经网络深度学习

1、Improved detection of small objects in road network sequences using CNN and super resolution

狼啸风云

2021/05/27

7890

哪些公共云备份选项可以更好地保护数据?

云计算

需要保护公共云资源的组织具有多种备份可能性，然而一些组织的公共云资源比其他组织更具危险性。备份基础架构即服务中公共云的资源，长期以来一直是IT专业人员面临的挑战。专为在内部数据中心使用而设计的备份

静一

2018/03/27

6860

JS混淆加密，该使用哪些配置选项？

javascript node.js javascript-framework

JS混淆加密工具，通常有众多的加密选项。比如，著名的JShaman，中文版有十余种配置选项、英文则有二十余种配置。

用户8703799

2023/07/13

2810

现场直击 | 李飞飞首度亮相谷歌云大会：发布全新API，解读AI民主化

其他

机器之心现场报道记者：CZ 当地时间 3 月 8-10 日，Google Cloud NEXT '17 大会在美国旧金山举行，机器之心作为受邀媒体进行了现场报道。大会首日，谷歌云高级副总裁 Diane Greene、谷歌 CEO Sundar Pichai、Alphabet 执行主席 Eric Schmidt 、谷歌云机器学习与人工智能首席科学家李飞飞分别做了 Keynote 演讲。去年 11 月份李飞飞加入谷歌引起了业内极大关注，此番首次亮相谷歌云大会自然也是大会首日的重头戏。在 Keynote 演

机器之心

2018/05/07

7390

哪些平台可以使用chatGPT？

chatgpt ip 插件教程

ChatGPT是一款由人工智能技术驱动的自然语言处理工具。它跟微软小冰、苹果siri不一样，它能够通过学习、并且理解人类的语言来进行对话，能真正像人类一样聊天交流，它还能完成撰写邮件、写脚本、写文案、翻译、检查程序代码等任务。那你知道国内哪些平台能用chatGPT？ChatGPT国内能用吗？接下来为大家解答。

用户10264843

2023/03/14

1.2K0

吴恩达机器学习笔记 —— 19 应用举例：照片OCR（光学字符识别）

机器学习图像处理

我们定义几个固定大小尺寸的窗口，从照片的左上角开始扫描。扫描出来的图像做二分类，判断是北京还是人物（文字）。然后根据图像处理的一些惯用手段做二值化、膨胀，使得文字区域连通。最终根据规则选择文本框就可以了，过滤那些规则不规整、宽度比高度小的矩形框框，剩下的就是目标文本框了。

用户1154259

2018/07/31

1K0

偏振镜光学原理和在机器视觉中的应用

有很多机器视觉检测对象物体的表面会发出杂乱的眩光（如抛光金属表面、烟盒、晶片等），这会严重影响成像质量，降低机

小白学视觉

2022/04/06

8610

图片内容转文字用Java怎么实现？

文字识别 spring spring boot

开发具有一定价值的符号是人类特有的特征。对于人们来说识别这些符号和理解图片上的文字是非常正常的事情。与计算机那样去抓取文字不同，我们完全是基于视觉的本能去阅读它们。

JAVA葵花宝典

2019/09/09

4.1K0

使用哪些指令可以提高加工精度？

min

使用“G41\G42\G40刀尖圆弧半径补偿”功能。如图所示，实际加工中的车刀刀尖不是理想的尖锐刀尖，它总有个小圆弧，刀具磨损还会改变圆角半径。数控车削轮廓时实际起作用的切削刃是圆弧的各切点，编程时却是根据理论刀尖（假想刀尖）A轨迹计算、编程，因此会产生加工误差。

lrglu

2022/05/16

5380

ocr字符识别原理及算法_产品系列之一

深度学习文字识别

最近入坑研究OCR，看了比较多关于OCR的资料，对OCR的前世今生也有了一个比较清晰的了解。所以想写一篇关于OCR技术的综述，对OCR相关的知识点都好好总结一遍，以加深个人理解。

全栈程序员站长

2022/09/20

3.2K0

点击加载更多

相似问题

谷歌移动视觉是否支持iOS上的光学字符识别？

如何在iOS上使用谷歌云视觉光学字符识别(swift)

如何使用谷歌的AutoML进行光学字符识别

232

光学字符识别

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

问哪些选项可以改善使用谷歌CLoud视觉的光学字符识别？
EN