经过大量的实验,我仍然不能让下面的脚本工作。我需要一些关于如何诊断这个特定Perl问题的指导。提前谢谢。
此脚本用于测试Office2007OCRAPI的使用:
use warnings;
use strict;
use Win32::OLE;
use Win32::OLE::Const;
Win32::OLE::Const->Load("Microsoft Office Document Imaging 12\.0 Type Library")
or
die "Cannot use the Office 2007 OCR API";
my $miD
我目前正在使用。
我的字串/词句中既有英文也有中文。
以下是问题所在:
如果句子在英语中是ALL,那么它在LUIS中工作得很好。原因很可能是因为一个句子是由不同的词组成的,这些词被一个“空格”分隔开来。
然而,在中文(繁体和简体)中,句子是由拼凑在一起,很难分开的词组成的。
例如,我可以用英语写:
I love you so much:这里有5个单词。在LUIS中,我可以选择I love you并将其转换为一个实体。稍后,当更多像I love you这样的词出现在LUIS中时,它可以很容易地识别出相关的意图。
然而,如果我用中文写:
我很喜歡你:它的意思和上面的英语一样。根据路易斯,它将被计算
我在一个历史目录中使用了光学字符识别(OCR),并试图用Microsoft来清理文本。具体来说,我需要一些帮助来编写正则表达式,以便将两行合并在一起。例如,某物
John Smith,87银行
Bldg
实际上应该是
John Smith,87 Bldg
我尝试过几种方法,但都没有成功。有人能帮我吗?
我正在尝试使用android ML Kit文本识别库进行文本识别,但在运行时遇到错误,没有返回任何文本。错误: W/TextNativeHandle: Native handle not yet available. Reverting to no-op handle.
W/DynamiteModule: Local module descriptor class for com.google.android.gms.vision.dynamite.ocr not found.
I/DynamiteModule: Considering local module com.google.and