我在PHP中使用fopen来打开从tesseract OCR提取的文件。返回的文本包含<<<<<<,fopen读取,直到找到第一个<字符,然后停止。
从OCR返回的文件:
P<dsdasdasd<<dasd<adsda<dsada<<<<<<<<<<ec<
dasdasdsdasdasdasdasd<<<<<<<<<<<<<<06
£ y
来自fopen的回声
P
如果我查
经过大量的实验,我仍然不能让下面的脚本工作。我需要一些关于如何诊断这个特定Perl问题的指导。提前谢谢。
此脚本用于测试Office2007OCRAPI的使用:
use warnings;
use strict;
use Win32::OLE;
use Win32::OLE::Const;
Win32::OLE::Const->Load("Microsoft Office Document Imaging 12\.0 Type Library")
or
die "Cannot use the Office 2007 OCR API";
my $miD