我们需要高容量扫描和ocr解决方案
我们正在谈论的是每天数字化大约4000个文档,并用ocr (带有隐藏文本)将它们保存为pdf文件……
该解决方案应该让操作员扫描文档,并自动将文件保存到特定的网络资源,以便由应用程序将其上传到数据库...
我们正在评估来自kofax http://www.kofax.com/的企业解决方案。
你还知道其他什么产品?
有类似需求的经验吗?
有没有开源的(或者至少是可访问的)解决方案?
com、activex api支持?
发布于 2009-07-18 01:19:00
有许多扫描产品的供应商可以做你想做的-扫描,索引,生成带有OCR覆盖的PDF (我个人更喜欢PDF中的OCR参考底图)。对于专门从事扫描的供应商来说,这些要求都是微不足道的。除了Kofax之外,仅列举几个其他供应商/产品:
许多文档管理解决方案也有内置的扫描前端,但它们的功能通常不如专门的捕获产品。几乎所有这些解决方案都支持COM/ActiveX API。我不知道任何用于扫描的开源解决方案,但我也没有真正搜索过。
大多数扫描软件供应商都使用“卷”或“容量”许可证。通常情况下,卷在期限结束时续订(即每年100万页-每年自动续订,无需额外成本)。因此,你并不是严格意义上的“每页”,如果你购买了每年100万张图片的容量,而你最终只扫描了50万页,你就得不到退款。这是可能的,尽管不太常见的是,一次性卷不会自动续订,当它用完时,您将被要求购买额外的卷。大多数供应商正在从软件狗转向控制数量,并转向软件许可。
关于的附注:
Kofax在历史上是通过增值经销商系统销售的,因此各种实现的质量可能会有很大差异。此外,它是高度可定制的,并有许多附加模块的各种风格,因此一个客户的Kofax系统可以显着不同于其他系统。
Kofax在企业级系统中使用,每年扫描和自动捕获数百万文档。它在文档扫描市场中占有相当大的份额。不,我不是Kofax的粉丝,如果我是,我就不会提到竞争产品;但是,我对它非常熟悉。与市场上的其他产品一样,它也有优势和劣势。我意识到Michael只是在转述他所听到的,但我不能让这种笼统的概括没有评论地通过。说一个市场占有率很高的产品对扫描来说是“不实用或用户友好的”,就像说"Windows不是一个有用的服务器操作系统“一样。这只是一个过于宽泛的概括。
干杯,
布赖恩
发布于 2009-05-21 23:37:41
Kofax不是很有用,也不是用户友好的(根据我在县工作的同行)。这是足够的,但不是很好。
我们使用全Adobe解决方案。详细信息如下(我不负责管理该区域,因此我必须为您收集一些信息)。
更新:我们使用
Adobe Acrobat Capture 3.0
两台理光彩色扫描仪IS760D,带ADF
Acrobat标准版或专业版(取决于用户)
我们有一个庞大的资料库(近6,000个文档),有数十万个扫描过的页面可用。进行扫描的电脑上有一个我们购买的加密狗(250,000次扫描,直到我们需要购买一个‘更新’);我没有可用的费用,因为处理这一天的先生已经回家了,但我记得它是在微分每页。
我们经常扫描几百页的文档,这一天需要完成,完成这项任务没有任何问题。
如果你想了解我们所做的工作,可以在http://acequia.ccrfcd.org/FileLibrary2/FileLibrary.aspx上找到我们的一些努力的链接( web前端,或到我们的库的排序)。
至于将这些PDF放入数据库中,很容易创建一个应用程序(可能是一个服务)来监控一个目录,并在捕获运行后抓取其中弹出的每个PDF,将信息复制到数据库中,然后删除它或将其移动到它的新主页。
发布于 2009-09-10 22:18:42
PSIGEN是Kofax的一个很好的替代品,功能丰富,价格合理。
Kofax Alternative Scanning and Capture Application
https://stackoverflow.com/questions/895773
复制相似问题