字体识别算法开源_字体识别算法_开源人脸识别算法 - 腾讯云开发者社区

银行卡扫描识别 Ctrip Tech 背景介绍：图像识别是人工智能的一个重要领域。为了编制模拟人类图像识别活动的计算机程序，人们提出了不同的图像识别模型。图像识别经历了三个阶段的发展：文字识别，数字图像处理与识别，物体识别。文字识别的研究是从1950年开始的，一般是识别字母，数字和符号，从印刷文字识别到手写文字识别，应用非常广泛。随着智能手机兴起，手机支付的行为越来越普及。但是用户在手机上输入银行卡卡号时，速度很慢，需要仔细的校对，用户体验很差。美国的PAYPAL 、苹果公司，中国的阿里公司和腾讯都在

Github：深度学习文本检测识别（OCR）精选资源汇总

今天跟大家推荐一个Github项目，来自NAVER Clova AI Research的hwalsuklee同学汇总了近几年的基于深度学习进行文本检测、识别的论文、代码、数据集、教程资源，非常值得参考。

您找到你想要的搜索结果了吗？

是的

没有找到

OpenCV 4基础篇| OpenCV简介

01. OCR 文字识别学习路径

由于最近在接触一些OCR的工作，所以本期《晓说AI》和大家分享一下我的一些总结，先从基本的概念讲起。如有错误，还请指正，谢你3千遍。如有疑问，欢迎留言，我会第一时间答复。

【合合TextIn】智能文档处理系列—电子文档解析技术全格式解析

在当今的数字化时代，电子文档已成为信息存储和交流的基石。从简单的文本文件到复杂的演示文档，各种格式的电子文档承载着丰富的知识与信息，支撑着教育、科研、商业和日常生活的各个方面。随着信息量的爆炸性增长，如何高效、准确地处理和分析这些电子文档，已经成为信息技术领域面临的一大挑战。在这一背景下，电子文档解析技术应运而生，并迅速发展成为智能文档处理技术中的一个关键组成部分。

WEB前端压缩看这里就够了

0写在前面 web前端在越来越多的Hmtl5游戏 web App的复杂的web运用中需要更多有针对的压缩方案。本文抛砖引玉，聊一下基于前端javascript以及Html5线上有损图像压缩，无损数据压缩方案等运用。 web项目需求中有很多资源压缩优化有很多不错的方案比如针对文本js的compress 以及服务器gzip，比如sprite雪碧图+png压图。在越来越多的Hmtl5游戏 webApp的复杂的web运用中需要更多有针对的压缩方案。本文抛砖引玉，聊一下基于前端javascript以及H

Python | 用机器学习搞定数字验证码，还有谁？！

来源：http://www.hi-roy.com/2017/09/19/Python验证码识别

GitHub 热榜：文字识别神器，超轻量级中文 OCR！

光学字符识别（OCR）技术已经得到了广泛应用。比如发票上用来识别关键字样，搜题 App 用来识别书本上的试题。

斯坦福吴恩达团队公布最大医学影像数据集

原作 Jackie Snow Root 编译自 MIT Technology Review 据报道，全球现在超过17亿人的肌肉骨骼都出毛病，每年大概有3千万的急诊病例，而且这个数字还在往上走。骨骼方

GitHub 热榜：文字识别神器，超轻量级中文 OCR！

光学字符识别（OCR）技术已经得到了广泛应用。比如发票上用来识别关键字样，搜题 App 用来识别书本上的试题。

超轻量级中文OCR，支持竖排文字识别、ncnn推理，总模型仅17M

光学字符识别（OCR）技术已经得到了广泛应用。比如发票上用来识别关键字样，搜题App用来识别书本上的试题。

图形验证码识别技术

阻碍我们爬虫的。有时候正是在登录或者请求一些数据时候的图形验证码。因此这里我们讲解一种能将图片翻译成文字的技术。将图片翻译成文字一般被成为光学文字识别（Optical Character Recognition），简写为OCR。实现OCR的库不是很多，特别是开源的。因为这块存在一定的技术壁垒（需要大量的数据、算法、机器学习、深度学习知识等），并且如果做好了具有很高的商业价值。因此开源的比较少。这里介绍一个比较优秀的图像识别开源库：Tesseract。

图像OCR技术实践，让前端也能轻松上手图像识别

首先和大家演示一下实现的效果，我们的最终目标是基于一张图片，通过技术的手段自动提取图片的信息，并展示到文档中，提高文档编写的效率。

基于编码注入的对抗性NLP攻击

研究表明，机器学习系统在理论和实践中都容易受到对抗样本的影响。到目前为止，此类攻击主要针对视觉模型，利用人与机器感知之间的差距。尽管基于文本的模型也受到对抗性样本的攻击，但此类攻击难以保持语义和不可区分性。在本文中探索了一大类对抗样本，这些样本可用于在黑盒设置中攻击基于文本的模型，而无需对输入进行任何人类可感知的视觉修改。使用人眼无法察觉的特定于编码的扰动来操纵从神经机器翻译管道到网络搜索引擎的各种自然语言处理 (NLP) 系统的输出。通过一次难以察觉的编码注入——不可见字符（invisible character）、同形文字（homoglyph）、重新排序（reordering）或删除（deletion）——攻击者可以显着降低易受攻击模型的性能，通过三次注入后，大多数模型可以在功能上被破坏。除了 Facebook 和 IBM 发布的开源模型之外，本文攻击还针对当前部署的商业系统，包括 Microsoft 和 Google的系统。这一系列新颖的攻击对许多语言处理系统构成了重大威胁：攻击者可以有针对性地影响系统，而无需对底层模型进行任何假设。结论是，基于文本的 NLP 系统需要仔细的输入清理，就像传统应用程序一样，鉴于此类系统现在正在快速大规模部署，因此需要架构师和操作者的关注。

Chinese Text in the Wild 学习笔记

在本文中，我们用自然图像中包含的文字创建了一个大型数据集，名为Chinese Text in the Wild（CTW）。该数据集包含32,285张带有1,018,402个中文字符的图像，远远超出了之前的数据集，这些图片来自腾讯街景，从中国数十个不同的城市获取，没有任何特殊目的。由于其多样性和复杂性，该数据库存在极大的挑战性。它包含平面文本，凸起文本，城市文本，农村文本，低亮度文本，远处文本，部分遮挡文本等。对于每个图像，我们注释其所有中文。对每一个中文字符，我们注释它的底层字符，边界框和6个属性，以指示它是否被遮挡，复杂背景，扭曲，3D文字，艺术字和手写体。

（数据科学学习手札155）基于martin为在线地图构建字体切片服务

大家好我是费老师，在之前的一篇文章（基于martin的高性能矢量切片地图服务构建）中我为大家介绍过martin的安装与使用，它是由maplibre开源维护的新一代高性能地图服务框架，底层基于rust，使得其可以以远胜于geoserver等传统地图服务框架的效率，进行矢量切片地图服务的发布。

文艺青年居家旅行必备，Spector让你捕捉生活中的美

相信很多人都碰到过这样的情况，偶然碰到令人心仪的创意字体或是美丽景色的话，我们可以选择用摄像机拍摄下来将其收藏。但是如果想要在自己的作品上应用这种颜色或是字体的话，却是爱莫能助的。但现在，这种不可能

OCR光学字符识别方法汇总

文本是人类最重要的信息来源之一，自然场景中充满了形形色色的文字符号。光学字符识别（OCR）相信大家都不陌生，就是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程。

能直接复制图片中文字，功能远超普通OCR软件，MIT学生开发了一款强大Chrome插件

有时你遇到一篇古老的文献，PDF文档还是扫描版。又或者是遇到一幅网页版海报，上面的文字你完全看不懂。

GitHub高赞：给文字打马赛克=形同虚设，AI看透你一切小心思，已开源

点击上方蓝色“程序猿DD”，选择“设为星标” 回复“资源”获取独家整理的学习资料！继修复涂鸦图片之后，厚码文字也不再安全了？近日，名为Depix的Github项目火爆全网，一切故意而为之的“文字密码”，在这一AI技术的处理下，瞬间就“暴露于光天之下”。 “来P个图吧！” “好呀，不过这段话得打码，不然就麻烦了！” 如果现在告诉你，”打码“已经不再安全，你所想保护的信息，已然如”皇帝的新衣“，你会作何想？不，这不是耸人听闻，最近一个名为Depix的GitHub项目火了，上线仅仅三天，star量就已经高达

PixelAI ：手淘客户端上的实时视觉算法应用

大家好，我是李晓波（篱悠），目前在淘宝任职高级算法专家。本次分享将从设计原则与整体架构、基础算法和上层应用三个部分来介绍手淘视频业务在客户端上实时视觉算法领域的探索。

旷视科技姚聪博士：深度学习时代的文字检测与识别技术 | AI 研习社 103 期大讲堂

AI 科技评论按：随着深度学习的兴起和发展，计算机视觉领域发生了极大的变化。作为计算机视觉中一个重要的研究课题，场景文字检测和识别也无法避免地被这股浪潮席卷，一起进入了深度学习的时代。近年来，这个问题的研究者们都共同见证了思维、方法和性能方面的巨大变化，本次公开课的嘉宾将与大家分享相关内容。

R语言︱文本挖掘之中文分词包——Rwordseg包(原理、功能、详解)

笔者寄语：与前面的RsowballC分词不同的地方在于这是一个中文的分词包，简单易懂，分词是一个非常重要的步骤，可以通过一些字典，进行特定分词。大致分析步骤如下：

Github高赞：给文字打马赛克=形同虚设，AI看透你一切小心思，已开源

---- 新智元报道编辑：keyu 【新智元导读】继修复涂鸦图片之后，厚码文字也不再安全了？近日，名为Depix的Github项目火爆全网，一切故意而为之的“文字密码”，在这一AI技术的处理下，瞬间就“暴露于光天之下”。 “来P个图吧！” “好呀，不过这段话得打码，不然就麻烦了！” 如果现在告诉你，”打码“已经不再安全，你所想保护的信息，已然如”皇帝的新衣“，你会作何想？不，这不是耸人听闻，最近一个名为Depix的GitHub项目火了，上线仅仅三天，star量就已经高达7K。截止发文，此项目已

走进AI时代的文档识别技术之文档重建

导读：作者系腾讯QQ研发中心——CV应用研究组的totoralin。本文主要介绍基于深度学习的文档重建框架，通过文档校正、版面分析、字体识别和阅读排序将纸质文档智能转成可编辑的电子文档。相比较传统的OCR技术，更加完整地恢复出文档关键图表等内容，提高用户文档处理的效率。 1、相关背景随着知识爆炸，借助纸质媒体、网络媒体等途径每天我们都在接触大量的信息。但是当我们发现某些信息是有启发性、有价值的，又苦于如何将这些信息沉淀下来。由于这些信息载体丰富多样，有的是纸质书有的是网页报道有的是PDF电子书，没有

深入浅出了解OCR识别票据原理

光学字符识别技术（OCR）目前被广泛利用在手写识别、打印识别及文本图像识别等相关领域。小到文档识别、银行卡身份证识别，大到广告、海报。因为OCR技术的发明，极大简化了我们处理数据的方式。

javaCV文字识别篇汇总：Tesseract介绍，Java如何使用Tesseract识别字符，如何使用Tesseract训练中文数据模型，Tesseract支持哪些格式标注数据

Tesseract 是一个开源的 OCR（光学字符识别）引擎，最初由惠普实验室开发，后来由 Google 接管并开源。OCR 是一种将图像中的文本转换为可编辑文本的技术，它可以自动识别图像或扫描文档中的文字，并将其转换为数字形式。

Python通过Tesseract库实现文字识别

从Google的无人驾驶汽车到可以识别假钞的自动售卖机，机器视觉一直都是一个应用广泛且具有深远的影响和雄伟的愿景的领域。

让你的文字自动适配背景颜色

产品设计了一个人机校验组件，大致长这个样子。背景会每次随机取不同图片，开始的时候，箭头设置为蓝色。在背景为蓝色的时候，用户就分辨箭头就有些困难了。怎么解决这个问题呢？

优Tech分享 | 通用文字识别的问题和算法

图像文字作为信息传递的重要载体，图像文字识别对于高效化办公，场景理解等有着重要的意义。

深入浅出了解OCR识别票据原理

本文介绍了如何通过光学字符识别（OCR）技术来识别收据中的文本内容，并探讨了在识别过程中可能遇到的文本噪声问题，以及如何解决这些问题。同时，文章还介绍了如何使用CNN和LSTM等深度学习技术来提高文本识别的准确率。

STM32项目设计：基于STM32F4的电子阅读器制作教程[通俗易懂]

哔哩哔哩视频链接：https://www.bilibili.com/video/BV1Y64y1f7Ji/代码资料链接：https://download.csdn.net/download/mbs520/13510169 百度网盘资料链接：https://pan.baidu.com/s/1NHRFNa8Qn7M286kv4WnHKA 提取码：abcd 电子小说阅读器v1.2版本：修复闪屏，导入图书失败等BUG https://download.csdn.net/download/mbs520/85055345 取走记得点赞

基于谷歌街景多位数字识别技术：TensorFlow的车牌号识别系统

开发该项目的环境要求有Python,Tensorflow,OpenCV和NumPy等软件。源代码在这里。

牛逼！50.3K Star！一个自动将屏幕截图转换为代码的开源工具

在当今快节奏的软件开发环境中，设计师与开发者之间的协同工作显得尤为重要。然而，理解并准确实现设计稿的意图常常需要耗费大量的时间和沟通成本。为此，开源社区中出现了一个引人注目的项目——screenshot-to-code，它利用AI人工智能技术（机器学习算法和视觉分析技术），将屏幕截图自动转换为前端代码，为设计师和开发者之间的合作开辟了新的可能性。

OCR技术综述

最近入坑研究OCR，看了比较多关于OCR的资料，对OCR的前世今生也有了一个比较清晰的了解。所以想写一篇关于OCR技术的综述，对OCR相关的知识点都好好总结一遍，以加深个人理解。什么是OCR？ OCR英文全称是Optical Character Recognition，中文叫做光学字符识别。它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来，并转换成一种计算机能够接受、人又可以理解的格式。文字识别是计算机视觉研究领域的分支之一，而且这个课题已经是比较成熟了，并且在商业中已经有很多落地项目了。比如汉

Python如何基于Tesseract实现识别文字功能

从Google的无人驾驶汽车到可以识别假钞的自动售卖机，机器视觉一直都是一个应用广泛且具有深远的影响和雄伟的愿景的领域。

AI 字体世界地图：用 AI 和机器学习辨析各种字体的审美特征

【新智元导读】著名设计机构 IDEO 项目负责人 Kevin Ho 受到李飞飞高徒 Andrej Karpathy 做的“图像地图”的启发，用机器学习算法通过视觉特征对字体进行排序和分类，形成了一个“字体地图”，可以帮助设计人员更简单地发现具有相似审美特征的字体。机器学习都能干什么？太多了。比如本文的作者 Kevin Ho ( 著名设计机构 IDEO 项目负责人) 就发现一张让他印象深刻的图像。这张奇妙的图片地图是由李飞飞的高徒 Andrej Karpathy 使用 AI 图像识别技术将数千张照片统合形

NB 的开源项目遍地开花——GitHub 热点速览 Vol.41

本周的 GitHub 热点速览的关键词便是 nb，也是本周特推之一的项目名字，这个功能如名字一般 nb 的项目是一个脚本，帮你处理笔记、书签、归档和知识库应用程序。如果你觉得 nb 不过如此，GHunt 便是另外一个 NB 的项目，没想到有一天你可以通过一个 gmail 邮箱，便可以了解到这个账号对应的“隐私”信息吧。

AI加持的WPS来了：金山开源全球首个办公DL框架KSAI-Lite

机器之心原创作者：泽南自动生成 PPT，自动图片转文字 + 翻译，甚至自动辅助写文章…… 办公自动化的未来已来。 WPS 是个已有超过 30 年历史的办公软件，但它最近的用户数量增长却越来越快——这款工具目前已有接近 4.9 亿活跃用户，其中还包括 1 亿海外用户。如此受欢迎的原因当然是因为最近的大幅升级，如今在 WPS 上你会发现不少 AI 能力的加持。 7 月 22 日，金山办公在珠海举行了首次技术开放日。在活动中这家公司不仅展示了 WPS 上最新应用的技术，还发布了 KSAI-lite，业内第

【OCR技术系列一】光学字符识别技术介绍

注：此篇内容主要是综合整理了光学字符识别和OCR技术系列之一】字符识别技术总览，详情见文末参考文献

我为NET狂官方群福利贴：一些常用的工具（上）

本次更新下载：http://pan.baidu.com/s/1skXzG4H 源码文档见官方群（以下为7.4更新内容）逆天工具 CDN 资源库国内 Bootstrap中文网开源项目免费 CDN

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐