经过大量的实验,我仍然不能让下面的脚本工作。我需要一些关于如何诊断这个特定Perl问题的指导。提前谢谢。
此脚本用于测试Office2007OCRAPI的使用:
use warnings;
use strict;
use Win32::OLE;
use Win32::OLE::Const;
Win32::OLE::Const->Load("Microsoft Office Document Imaging 12\.0 Type Library")
or
die "Cannot use the Office 2007 OCR API";
my $miD
有没有人有经验,如何OCR几个图像,并创建一个输出PDF文件与识别的文本在C#中的Nicomsoft OCR?看起来它可以做到,但是我的C#代码由于某些原因没有生成任何PDF:
NSOCRLib.NSOCRClass NsOCR = new NSOCRLib.NSOCRClass();
NsOCR.Engine_InitializeAdvanced(out CfgObj, out OcrObj, out ImgObj);
for (i = 0; i < ImageCnt; i++)
{
NsOCR.Img_LoadFile(ImgObj, ImageFiles[i]);
N
我有一个方法,在我们的软件,从PDF,从扫描或文本生成的文本。
我通常先尝试GetTextFromPage()方法。如果它不返回文本,那么我将移到页面的OCR上。
我有一个特别的6页PDF,前三页是扫描文件,最后两页是一份表格。
在这个PDF文件中,我得到了一个我无法解决的错误。
'StandardEncoding' is not a supported encoding name. For information on defining a custom encoding, see the documentation for the Encoding.RegisterProv