ocr - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签ocr

#ocr

大模型终于能读千页文档了！DeepSeek-OCR 用 1 招压缩 10 倍，准确率还能 97%

HELLO程序员

GSK(中国) ｜全栈架构师 (已认证)

1天前2026-06-26 20:50:56

“给大模型喂一份 1000 页的财报，它要么‘内存爆炸’，要么切片段后逻辑全乱 —— 这难题终于被破解了！” 近期 DeepSeek 发布的 DeepSeek-...

3310

Glyph：文本转图片解决长上下文困境，智谱把“DeepSeek-OCR”具像化了

用户11563501 4天前2026-06-23 10:22:08

传统的 token 扩展方式已经走到了算力成本的天花板。与其硬扛百万级 token 的计算压力，不如让 AI "看"文字，而不是"读"文字。

7810

物流提单智能解析：覆盖海运、空运与海运单的自动化处理方案（附GitHub项目地址）

合合技术团队 9天前2026-06-18 20:04:26

项目介绍：这是一个面向国际物流与供应链场景的提单智能解析工具。支持上传 PDF、扫描件及拍照件格式的海运提单、海运单、空运单等运输单据，自动识别单据类型，抽取发...

9110

融合“身份证识别+活体检测+数据比对”的人脸核身技术，赋能政务、金融、民生、互联网等多个领域的数字化实名认证场景

中科逸视OCR专家 9天前2026-06-18 17:15:32

在数字化身份认证全面普及的当下，传统账号密码、静态证件核验模式已无法满足远程、高效、高安全的身份校验需求。人脸核身技术作为新一代可信身份认证核心方案，深度融合身...

19610

FireRed-OCR开源：2B模型拿下文档解析第一

代码简单说 11天前2026-06-16 16:23:50

在做知识库构建和 RAG 项目时，我踩过最多的坑，不是向量检索，而是文档结构还原。

16710

智谱GLM视觉模型家族横向评测：从轻量OCR到多模态Agent，一文搞清怎么选

代码简单说 11天前2026-06-16 13:24:13

通过 API 统一接入 zai-sdk，可轻松搭建高可用、低延迟的视觉智能工作流。

38810

[开源]一个 Rust 库搞定 macOS/Windows/Linux 三端 OCR：uniOCR 的 6 个使用要点

DevLlama 12天前2026-06-15 14:35:51

uniOCR 就是为了这件事而生的——一个 Rust crate，把上面这些底层差异全部封进同一个 OcrEngine 接口。你写一次代码，三端跑通，云端切换只...

13910

#ocr

大模型终于能读千页文档了！DeepSeek-OCR 用 1 招压缩 10 倍，准确率还能 97%

Glyph：文本转图片解决长上下文困境，智谱把“DeepSeek-OCR”具像化了

物流提单智能解析：覆盖海运、空运与海运单的自动化处理方案（附GitHub项目地址）

融合“身份证识别+活体检测+数据比对”的人脸核身技术，赋能政务、金融、民生、互联网等多个领域的数字化实名认证场景

FireRed-OCR开源：2B模型拿下文档解析第一

智谱GLM视觉模型家族横向评测：从轻量OCR到多模态Agent，一文搞清怎么选

[开源]一个 Rust 库搞定 macOS/Windows/Linux 三端 OCR：uniOCR 的 6 个使用要点

热门专栏

腾讯开源的专栏

程序猿DD

量子位

橙、

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐