前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >PaddleOCR 高精度文字识别:丰富多样的前沿算法 | 开源日报 No.187

PaddleOCR 高精度文字识别:丰富多样的前沿算法 | 开源日报 No.187

作者头像
小柒
发布2024-02-26 14:47:24
2200
发布2024-02-26 14:47:24
举报
文章被收录于专栏:开源服务指南开源服务指南

PaddlePaddle/PaddleOCRhttps://github.com/PaddlePaddle/PaddleOCR

Stars: 34.1k License: Apache-2.0

PaddleOCR 是一个丰富、领先和实用的 OCR 工具库,旨在帮助开发者训练更好的模型并将其应用到实际场景中。该项目具有以下特点和优势:

  • 支持多种 OCR 相关前沿算法
  • 提供产业级特色模型 PP-OCR、PP-Structure 和 PP-ChatOCR
  • 打通数据生产、模型训练、压缩和预测部署全流程

modularml/mojohttps://github.com/modularml/mojo

Stars: 15.3k License: NOASSERTION

Mojo 是一个新的编程语言,它通过将 Python 语法和生态系统与系统编程和元程序设计功能相结合,弥补了研究和生产之间的差距。Mojo 还年轻,但计划随着时间推移逐步开源,并且正在快速变化中。Mojo 旨在成为 Python 的超集。该项目具有以下核心优势:

  • 可以使用现有的 Python 库和工具
  • 具备系统级别编程能力
  • 支持元程序设计特性

o3de/o3dehttps://github.com/o3de/o3de

Stars: 6.8k License: NOASSERTION

O3DE (Open 3D Engine) 是一个开源的、实时的、多平台的三维引擎,使开发者和内容创作者能够构建 AAA 游戏、影院质量的三维世界和高保真度模拟,而无需支付任何费用或商业义务。

  • 免费使用并没有商业义务
  • 支持跨平台
  • 构建 AAA 级别游戏以及高保真度模拟

NVIDIA/TensorRT-LLMhttps://github.com/NVIDIA/TensorRT-LLM

Stars: 2.7k License: Apache-2.0

TensorRT-LLM 是一个用于大型语言模型的 TensorRT 工具箱,它提供了易于使用的 Python API 来定义和构建包含最先进优化的 TensorRT 引擎,用于在 NVIDIA GPU 上高效执行推理。该项目还包括创建 Python 和 C++ 运行时环境以及与 NVIDIA Triton Inference Server 集成的后端。其核心优势和主要功能如下:

  • 支持从单个 GPU 到多节点多 GPU 配置
  • Python API 类似于 PyTorch API,并提供常用函数 (如 einsumsoftmaxmatmul 或者 view) 和有用组件 (例如 Attention 块、MLP 或整个 Transformer 层)
  • 内置支持 INT4/INT8 权重量化和 SmoothQuant 技术
  • 提供预定义模型并可轻松修改扩展适应自定义需求

public-apis-dev/public-apishttps://github.com/public-apis-dev/public-apis

Stars: 1.9k License: MIT

Public APIs 是一个开发者的协作公共 API 列表项目,主要功能是提供各种不同领域的公共 API。该项目具有以下核心优势和特点:

  • 提供了大量不同领域的 API,包括动物、动漫、反恶意软件等。
  • 每个 API 都有详细描述和认证方式,并指示是否支持 HTTPS 和 CORS。
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2024-02-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 开源服务指南 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • PaddlePaddle/PaddleOCRhttps://github.com/PaddlePaddle/PaddleOCR
  • modularml/mojohttps://github.com/modularml/mojo
  • o3de/o3dehttps://github.com/o3de/o3de
  • NVIDIA/TensorRT-LLMhttps://github.com/NVIDIA/TensorRT-LLM
  • public-apis-dev/public-apishttps://github.com/public-apis-dev/public-apis
相关产品与服务
文字识别
文字识别(Optical Character Recognition,OCR)基于腾讯优图实验室的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档