首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >OCR图形纸

OCR图形纸
EN

Stack Overflow用户
提问于 2009-06-20 15:59:54
回答 3查看 819关注 0票数 1

我想把一个扫描过的图形纸笔记本(有手写)的pdf格式转换成一个文本文件。

我该怎么做呢?

谢谢

EN

回答 3

Stack Overflow用户

发布于 2009-06-20 16:03:38

查看一个OCR库,比如OCRopus。我不认为它需要PDF,所以你可能必须先把它转换成TIFF或JPEG格式。

票数 1
EN

Stack Overflow用户

发布于 2009-06-20 18:52:38

有一些OCR库可以转换类型(OCRopus、tesseract等)。

还有一些基于Java的手写库。我不确定OCRopus是否有这种能力,我正在研究的一个手写识别库是:

Online Video

Java Neural Networks

可以想象,如果需要的话,你可以把pdf转换成tiff (根据软件),它会给你一些东西。

祝好运!

票数 1
EN

Stack Overflow用户

发布于 2009-06-20 16:20:07

如果它是PDF文件的笔记本,你可以通过电子邮件将其发送到gmail帐户,然后gmail允许你在浏览器中以HTML文件的形式“查看”PDF。页面仍然是图像。

如果您希望从中取出文本,OCR可能会起作用,但它也可能无法从中取出文本。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/1021900

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档