下面是我的代码:
import pytesseract
pytesseract.pytesseract.tesseract_cmd = r'F:\Installations\tesseract'
print(pytesseract.image_to_string('images/meme1.png', lang='eng'))
下面是图片:
输出结果如下:
GP.
ed <a
= va
ay Roce Thee .
‘ , Pe ship
RCAC Tm alesy-3
Pein Reg a
years —
? >
我已经从下载了pocketsphinx演示,并为我自己的目的做了一些修改。
我为我的应用程序特定的单词创建了一个新的my-en-us.dict (字典)文件,并添加了以下单词
hey HH EY
smarty S M AA R T IY
login L AA G IH N
然后,我用下面的代码创建了一个login.gram (语法)文件
#JSGF V1.0;
grammar login;
public <item> = login;
然后,我在我的活动中初始化了识别器,如下所示
public static final String KWS_SEARCH = "wak
如果我有一个句子sentence = 'There is light!',并且我要将这个句子与mysentence = sentence.split()分开,我将如何将输出作为'There, is, light, !' of print(mysentence)?我特别想要做的是拆分这个句子,包括所有标点符号,或者仅仅是一个选定标点符号的列表。我得到了一些代码,但程序是识别单词中的字符,而不是单词。
out = "".join(c for c in punct1 if c not in ('!','.',':
我试图使用Tesseract OCR从图像中提取字符串(不是有效单词)。问题是图像中的字符是分开的,如下图所示。
对于默认属性,此图像被识别为5 O M E T E—E X fT。
我试着修改页面分段属性,但我得到的最接近的是"SOME TEXT.和--psm 8。我想知道是否有一种设置可以让Tesseract更好地处理字母之间的间隔,或者我是否需要训练一个定制的模型。
我正在尝试添加一些命令到android默认的声控拨号程序。它有像打开,拨号,呼叫,重拨等命令,我想包括让我们说‘查找’到它。我已经从下载了源代码,并在Eclipse中进行了编译。应用程序为这些命令的参数设置语法,比如它存储联系人列表中的人员的姓名和电话号码,以便在CALL JOHN语音命令识别他们的姓名时生成意图。对于此命令中的CALL,它只是将得到的识别字符串的第一个单词与"CALL“进行比较。
我在onRecognitionSuccess()函数中添加了"FIND“作为额外的else if条件,如下所示:
public class CommandRecognizerEngi
我有一个句子列表,我想要识别其中至少没有一个单词与另一个列表中包含的单词相匹配的所有句子。我尝试使用列表理解来实现这一点,如下所示 [sentence for sentence in sentences if word_list is not in sentence] 这是不起作用的,因为我正在询问单词列表中的单词是否不在句子中。 我需要的关键功能是能够识别所有在单词列表中没有与单词匹配的单词的句子。我正在寻找ASR错误,我有一个单词列表,其中至少有一个必须在每个句子中或该句子有ASR错误。 我可以弄清楚如何使用grep -v并通过管道将它们连接在一起,但我想用Python语言来实现。
我正在尝试编写一个Python-3.6脚本,它将空的.aif音频记录(即仅包含环境噪声)与那些包含语音的音频记录分开。我的目标是而不是来识别语音内容--首先,它不是英语,其次,它不是我的目的所需要的。
尽管如此,我还是没有发明出比用SpeechRecognition和pocketsphinx来解决这个问题更好的方法。我的想法很原始:
import speech_recognition as sr
r = sr.Recognizer()
emptyRecords = []
for fname in os.listdir(TESTD
我试图使用point函数将PIL image反转并归一化为1;但是,我没有得到预期的结果!我试过的是这样(不知道哪里出了问题?)
data = data.point(lambda p: 1 if p < 127 else 0 ) # threshold, invert and normalize to 1
例如,当尝试
print(np.array(data).max())
打印True。
但是,将PIL Image转换为numpy数组然后将其反转是可行的,如下所示:
data = np.array(data.getdata(),
np.uint8).r
我有一个文本文件,在该文件中,我需要按降序打印最频繁出现的单词(及其出现的次数),直到我打印出的单词占文档总数的n%。
到目前为止,我已经编写了以下代码:
// Break the file into words
val lines = sc.textFile("somefile.txt")
val words = lines.flatMap(line => line.split(" "))
words.persist()
val wordCount = words.count()
val wordCounts = words.map(word =>
我正在使用Python 3,我想要的是识别一个单词是否在文本文件中。
文本文件的内容:
test
test
test
我的代码:
wordsUsedFilename = "usedwords.txt"
f = open(wordsUsedFilename, 'r')
usedWords = [line.strip() for line in f]
words = []
words.append("test")
check = True
while check:
for word in words:
if word
我有非常严重的问题要解决。我有一个75000字的单子。为便于识别,每个单词都分配了一个数字。第一个单词分配为0,最后一个单词分配为75000。现在,我有一个句子清单。让我们以一句为例。
I have big dog
当您用指定的数字表示这个值时,它就变成了20 123 2332 3434。这仅仅意味着单词I出现在我们的列表中作为第20个单词出现,单词 on 出现在我们的列表中的123个单词中,单词大出现在2332个单词上等等。
就像这样,我有超过20亿的句子,我需要保存/写出它们的数字表示。我们认为,为20亿张唱片节省像20 123 2332 3434这样的长数据将占用很大的空间。相反,如果我