离线文字 OCR SDK 是一种软件开发工具包,可在本地设备上实现文字识别功能,无需依赖网络连接2。以下是一些常见的离线文字 OCR SDK:
- 百度文字识别离线 SDK:可在手机、摄像头、执法记录仪等设备终端无网或弱网环境下对文字识别能力进行集成,支持 Android、Windows、iOS 等多种平台,能实现毫秒级快速响应。主要产品包含通用文字识别、车牌识别、身份证识别等,具有图像质量校验、多类型授权等功能。
- 腾讯云 OCR 文字识别:基于腾讯云的 AI 技术,提供离线文字识别能力,支持多种场景下的文字识别,如通用文字识别、身份证识别、银行卡识别、车牌识别等。
- tr - Text Recognition:一款针对扫描文档的离线中文文本检测与识别 SDK,核心代码采用 C++ 开发,并提供 Python 接口。采用 CRNN 与 Transformer 结合、YOLO 系列主干网络等技术,支持多行文本、弯曲文本、表格、图表等复杂场景下的文本识别,还能将图片编码成一维序列,实现端到端的文档理解。
- 阿里云文字识别离线版 SDK:可以在无网络环境下运行,支持多种离线文字识别任务,包括身份证识别、银行卡识别、面单手机号识别等。所有数据皆在设备本地运行处理,识别速度快,包体小。
- Umi-OCR:开源、免费的离线 OCR 软件,支持截屏 / 粘贴 / 批量导入图片,段落排版 / 排除水印,扫描 / 生成二维码等功能。内置多国语言库,方便切换,支持 PaddleOCR 和 RapidOCR 两种内核。
- TH-OCR 文字识别 SDK:支持多种部署方式,包括 B/S 端服务部署和 PC 端 SDK 集成部署,还支持 CPU 和 GPU 硬件配置的部署以及国产化操作系统的部署。具备卓越的表格还原功能,能精准识别表格结构并 1:1 还原,可识别多门语种,支持导出 JSON、TXT、双层 PDF 等格式文件。