前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >组件分享之后端组件——一个基于Golang的ORC组件包

组件分享之后端组件——一个基于Golang的ORC组件包

作者头像
cn華少
发布2022-04-02 13:15:20
1.2K0
发布2022-04-02 13:15:20
举报
文章被收录于专栏:IT综合技术分享IT综合技术分享

组件分享之后端组件——一个基于Golang的ORC组件包

背景

近期正在探索前端、后端、系统端各类常用组件与工具,对其一些常见的组件进行再次整理一下,形成标准化组件专题,后续该专题将包含各类语言中的一些常用组件。欢迎大家进行持续关注。

组件基本信息

内容

本节我们分享一个基于Golang的ORC组件包gosseract,当下对于图片识别的需求越来越多,难免我们需要在Go程序下进行图片的处理,本节我们就进行分享一个ORC的工具包gosseract,它是通过使用Tesseract c++库进行实现的,如果你想按照服务的方式使用,直接部署https://github.com/otiai10/ocrserver即可,支持docker部署,如果是在代码中使用就需要看下面的案例了。

代码语言:javascript
复制
package main

import (
    "fmt"
    "github.com/otiai10/gosseract/v2"
)

func main() {
    client := gosseract.NewClient()
    defer client.Close()
    client.SetImage("path/to/image.png")
    text, _ := client.Text()
    fmt.Println(text)
    // Hello, World!
}

代码中使用也比较简单,加载起来相关需要识别的图片就可以有效读取器内容信息,当然我们也可以在docconv组件中一起使用本次的OCR组件,详细可以参考Issues,这里面详细的说明了。

注:上述代码在运行时需要确保你当前环境下已经安装了tesseract-ocr,这里我们建议使用Ubuntu环境或容器环境下使用,具体tesseract-ocr安装可以参考Dockerfile,还是比较简单的,基本使用apt命令就可以快速安装好了。

本文声明:

知识共享许可协议

本作品由 cn華少 采用 知识共享署名-非商业性使用 4.0 国际许可协议 进行许可。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022.03.28 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 组件分享之后端组件——一个基于Golang的ORC组件包
    • 背景
      • 组件基本信息
        • 内容
        相关产品与服务
        文字识别
        文字识别(Optical Character Recognition,OCR)基于腾讯优图实验室的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档