我得到了这个错误,而解析的PDF文件使用pypdf2,我是随同错误的PDF附件。 I have attached the PDF to be parsed please click to view 有人能帮上忙吗? import PyPDF2
read_pdf = PyPDF2.PdfFileReader(pdfName) page_content = page.extractText()
我有一个关于Azure Form Recognizer的手写文本OCR的问题。 在Azure的示例标签工具中添加标签之前,在手写PDF文件上运行OCR时,OCR通常会错误地检测文本。对于其他表单分析和提取技术,通常提供一个选项来输入应该被检测到的文本,以本质上“校正”OCR。对于在示例标签工具(Docker图像)中训练Azure Form Recognizer,我看不到一种覆盖OCR文本并输入正确文本的方法。 有没有一种方法可以自己输入OCR检测不到或