我想做的基本上是:
我想我的问题可能与下面评论中的链接不同,因为我试图从中提取单词的图片是一本书中一页的手机图片。角度稍微偏了一点。我已经尝试过Adobe的OCR阅读器,它没有给我一个正确的输出。
我主要使用macOS。但是,我可以访问Windows 7(和10)和Linux。质量是第一位的,成本是次要的。我真的在寻找一个好的软件,我愿意花一些钱。
我总共需要处理100页。
发布于 2017-12-21 08:42:23
其中一个关键的OCR程序是Tesseract OCR,它是一个命令行、开源、Apache许可、跨平台工具。它是免费的,可以支持大量的语言(>100,包括Unicode支持),并且可以接受更多的培训。自1985年以来一直在发展,现在(2017年)仍在积极发展。它可以从源代码中获得,也可以作为Windows、Linux、Mac和Android的预置二进制文件使用。
与大多数OCR软件一样,它的准确性将取决于图像质量(您可能能够清除图像质量),可能还取决于字体等的培训包以及语言。例如,如果文本的角度倾斜,则值得使用图像编辑器(如瘸子 )来矫正图像的角度。
有许多GUI上市的这里在不同的许可证和不同的平台。
还有许多可用的web服务使用同样的技术,但要谨慎一点-不要将web服务用于专有或机密信息,因为某些此类服务的使用取决于您向世界发布信息和(或)某些服务保留以它们选择的任何方式使用您的信息的权利。
发布于 2017-12-20 20:22:26
如果将图像粘贴到MS OneNote中并右击图像,则有“从图片复制文本”的选项。然后你可以把它粘贴到你需要的地方。这种方法还远远不够完善。这取决于图像中文本的质量和使用的字体。但是,我已经从图像中提取了长长的文本。它可以比复制/打字更快,同时只需输入即可从文本中读取文本。
注意:我正在使用Windows版本。
https://softwarerecs.stackexchange.com/questions/47709
复制相似问题