我正在尝试使用Textract提取doem PDF文件中的文本。但是,当我打印代码末尾的文本时,它只打印出许多空格。有谁能告诉我发生了什么事吗?(顺便说一句,文本不是= "“)
发布于 2019-03-23 01:02:12
2个我通过python使用的函数(第二个需要tesseract)。实际上,我更喜欢tesseract one而不是pdfminer,但它们实际上做的是一样的事情。不知道你的代码出了什么问题,但我相信这些是可选的等价物。
https://stackoverflow.com/questions/54195882
复制相似问题