首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >c#将PDF转换为Tif

c#将PDF转换为Tif
EN

Stack Overflow用户
提问于 2012-08-31 04:40:07
回答 3查看 1.1K关注 0票数 0

我正在使用ghostscript转换PDF的Tif与C$类包装,然后是使用光学字符识别tessnet2读取图像文件的内容,但tif图像是相当不可读,图像是相当褪色的,看起来不正确,光学字符识别引擎无法读取任何东西。有没有开放源码或库,可以花我几块钱就可以将PDF转换成高质量的TIf?或者任何可以读取PDF的开源光学字符识别引擎,因为tessnet2不能读取PDF。

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2012-09-06 07:05:45

我必须将imageMagicNET类输出格式的属性更改为png16m和DPI,以便生成的图像质量高,并且可供OCR引擎读取。

票数 0
EN

Stack Overflow用户

发布于 2012-09-06 17:29:35

正如DaNet所说,我不确定是否有开放源码的动态链接库或免费的方式来做到这一点。我们使用一个名为leadtools的第三方工具包,它在OCR PDF文档时给我们非常好的结果。您可以使用它对图像进行一些处理(例如,对图像进行二值化,移除图像中不需要的点,将其转换为1位黑白图像,将其另存为TIF图像等),然后将其传递给OCR引擎。我知道他们有一个在线演示,你可以试试。这是演示的链接:http://demo.leadtools.com/OnlineRecognitionDemo

如果结果符合您的要求,您可以查看此教程:Scanning to Searchable PDF

票数 1
EN

Stack Overflow用户

发布于 2012-08-31 06:25:59

我不确定一个开源的OCR,但是如果你使用ghostscript生成的tiff的分辨率输出,你应该不会有问题。

尝试将-r150添加到ghostscript包装器的"string args“中,以更改分辨率,希望是一个像样的兆字节文件!

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/12205125

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档