问tesseractjs在一系列相同类型的图像上表现不佳
EN

Stack Overflow用户

提问于 2019-11-28 19:50:28

回答 1查看 33关注 0票数 0

我有一系列的图像，都是相同的大小，相同的格式，共享相同的配色方案，它们都有相同的文本格式。我想使用tesseractjs来返回它们的文本，但tesseract在所有这些文件上的工作方式并不相同。在一些图像上，它会返回另一些图像上的文本，而其他图像则不会。这是我的tesseract代码：

import { createWorker } from "tesseract.js";

const worker = createWorker();

(async () => {
  await worker.load();
  await worker.loadLanguage("eng");
  await worker.initialize("eng");
  const {
    data: { text }
  } = await worker.recognize("image.png");
  console.log(text);
  await worker.terminate();
})();

代码来源: tesseract.js github

javascript

node.js

tesseract.js

Stack Overflow用户

发布于 2019-11-28 21:51:13

虽然图像看起来如此清晰和易于阅读，但它们似乎有一定的噪声水平，其中一些图像的噪声水平更高，这使得tesseract失败，因此需要进行预处理才能获得良好的结果。

票数 0

查看全部 1 条回答

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/59088248

复制

相似问题

问tesseractjs在一系列相同类型的图像上表现不佳
EN

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问tesseractjs在一系列相同类型的图像上表现不佳EN

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问tesseractjs在一系列相同类型的图像上表现不佳
EN