我正在尝试使用R接口来测试tesseract来创建一个包含嵌入式文本的PDF文件。我已经看到了前面的问题,但是它是关于使用命令行接口进行tesseract的。这个问题是关于R界面的。我将tessedit_create_pdf选项设置为1,但没有得到新的pdf文件。我没有看到设置输出文件的选项。如何使tesseract创建一个带有嵌入式文本的pdf?下面的代码在内存中生成很好的文本,但是没有PDF文件。tesseract(language = "eng",
o
我试图从我从pdf文件中提取的文本中搜索一个单词,这是OCR的格式。这个pdf文件有多个页面,所以对于每个页面,我都在搜索这个单词,如果找到了这个单词,然后编写文件名,或者不存在),找到它的 page ,以及它找到的 word 。","west","para")tc=c()x=list()Status="Present"
valoare="";tessnet2.Tesseract ocr= new tessnet2.Tesseract();
ocr.Init(@"F:\Manipulare pdf\bin(1)\Release32\tessdata", "eng", false);var rect = new System.