前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Tess4J 简单使用入门[通俗易懂]

Tess4J 简单使用入门[通俗易懂]

作者头像
全栈程序员站长
发布2022-06-30 18:19:24
1.8K1
发布2022-06-30 18:19:24
举报
文章被收录于专栏:全栈程序员必看

大家好,又见面了,我是你们的朋友全栈君。

一.简介

Tesseract-OCR支持中文识别,并且开源和提供全套的训练工具,是快速低成本开发的首选。而Tess4J则是Tesseract在Java PC上的应用。在英文和数字识别中性能还是不错的,但是在中文识别中,无论速度还是识别率还是较弱,建议有条件的话,针对场景进行训练,会获得较好结果,本文仅对目前Tess4J的用法进行介绍

二.入门教程

1.去Tess4J官网下载最新的源码包

Tess4J官网.

我们现在最新的是3.4.8

Tess4J-3.4.8-src下载地址.

2.创建Java项目并配置Tess4J
  • 下载下来的Tess4J目录一般都是如下
在这里插入图片描述
在这里插入图片描述
  • dist:综合jar,不需要配置dll
  • lib:所有相关的jar包
  • src:源码包
  • tessdata:训练好的字体模型
  • test:测试用例

这里要把dist下的jar包和lib下的jar包都要导入Java项目中

3.一个Demo
代码语言:javascript
复制
 		File file = new File("D:\\1.jpg");
        ITesseract instance = new Tesseract();
        instance.setDatapath("...");//设置你的Tess4J下的tessdata目录
        instance.setLanguage("eng");//指定需要识别的语种
        String result = instance.doOCR(file);
        System.out.println(result);
  • 其中语种就在tessdata目录下
  • 你如果要识别的是其他语种
  • 可以去其他语种.把对应的traineddata下载放这里

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/132239.html原文链接:https://javaforall.cn

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一.简介
  • 二.入门教程
    • 1.去Tess4J官网下载最新的源码包
      • 2.创建Java项目并配置Tess4J
        • 3.一个Demo
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档