首页
学习
活动
专区
圈层
工具
发布

#ocr

大模型终于能读千页文档了!DeepSeek-OCR 用 1 招压缩 10 倍,准确率还能 97%

HELLO程序员

GSK(中国) | 全栈架构师 (已认证)

“给大模型喂一份 1000 页的财报,它要么‘内存爆炸’,要么切片段后逻辑全乱 —— 这难题终于被破解了!” 近期 DeepSeek 发布的 DeepSeek-...

3310

Glyph:文本转图片解决长上下文困境,智谱把“DeepSeek-OCR”具像化了

用户11563501

传统的 token 扩展方式已经走到了算力成本的天花板。与其硬扛百万级 token 的计算压力,不如让 AI "看"文字,而不是"读"文字。

7810

物流提单智能解析:覆盖海运、空运与海运单的自动化处理方案(附GitHub项目地址)

合合技术团队

项目介绍:这是一个面向国际物流与供应链场景的提单智能解析工具。支持上传 PDF、扫描件及拍照件格式的海运提单、海运单、空运单等运输单据,自动识别单据类型,抽取发...

9110

融合“身份证识别+活体检测+数据比对”的人脸核身技术,赋能政务、金融、民生、互联网等多个领域的数字化实名认证场景

中科逸视OCR专家

在数字化身份认证全面普及的当下,传统账号密码、静态证件核验模式已无法满足远程、高效、高安全的身份校验需求。人脸核身技术作为新一代可信身份认证核心方案,深度融合身...

19610

FireRed-OCR开源:2B模型拿下文档解析第一

代码简单说

在做知识库构建和 RAG 项目时,我踩过最多的坑,不是向量检索,而是文档结构还原。

16710

智谱GLM视觉模型家族横向评测:从轻量OCR到多模态Agent,一文搞清怎么选

代码简单说

通过 API 统一接入 zai-sdk,可轻松搭建高可用、低延迟的视觉智能工作流。

38810

[开源]一个 Rust 库搞定 macOS/Windows/Linux 三端 OCR:uniOCR 的 6 个使用要点

DevLlama

uniOCR 就是为了这件事而生的——一个 Rust crate,把上面这些底层差异全部封进同一个 OcrEngine 接口。你写一次代码,三端跑通,云端切换只...

13910
领券