我有一个PDF文件,其中包含我们需要导入到数据库中的数据。该文件是打印文本的pdf扫描。数据的结构如下
N° Facture : 45526203
Date : 01/12/2014
Nom de la société : company
但这些数据并不总是出现在document.So的相同区域中,我需要一个可以识别这些文件的工具或应用程序接口。任何建议都是值得感谢的。
发布于 2015-01-23 06:19:44
ABBYY Cloud OCR SDK可以做到。
使用processTextField方法识别文本字段。
您可以在ABBYY's website上找到详细的文档。
如果你需要任何帮助,请不要犹豫在评论中问我(我在ABBYY工作)。
https://stackoverflow.com/questions/28064446
复制相似问题