字体识别算法_字体识别算法开源_字体锐化算法 - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

携程2015 Open House获奖项目：银行卡扫描识别

银行卡扫描识别 Ctrip Tech 背景介绍：图像识别是人工智能的一个重要领域。为了编制模拟人类图像识别活动的计算机程序，人们提出了不同的图像识别模型。图像识别经历了三个阶段的发展：文字识别，数字图像处理与识别，物体识别。文字识别的研究是从1950年开始的，一般是识别字母，数字和符号，从印刷文字识别到手写文字识别，应用非常广泛。随着智能手机兴起，手机支付的行为越来越普及。但是用户在手机上输入银行卡卡号时，速度很慢，需要仔细的校对，用户体验很差。美国的PAYPAL 、苹果公司，中国的阿里公司和腾讯都在

05

Chinese Text in the Wild 学习笔记

在本文中，我们用自然图像中包含的文字创建了一个大型数据集，名为Chinese Text in the Wild（CTW）。该数据集包含32,285张带有1,018,402个中文字符的图像，远远超出了之前的数据集，这些图片来自腾讯街景，从中国数十个不同的城市获取，没有任何特殊目的。由于其多样性和复杂性，该数据库存在极大的挑战性。它包含平面文本，凸起文本，城市文本，农村文本，低亮度文本，远处文本，部分遮挡文本等。对于每个图像，我们注释其所有中文。对每一个中文字符，我们注释它的底层字符，边界框和6个属性，以指示它是否被遮挡，复杂背景，扭曲，3D文字，艺术字和手写体。

02

您找到你想要的搜索结果了吗？

是的

没有找到

文艺青年居家旅行必备，Spector让你捕捉生活中的美

相信很多人都碰到过这样的情况，偶然碰到令人心仪的创意字体或是美丽景色的话，我们可以选择用摄像机拍摄下来将其收藏。但是如果想要在自己的作品上应用这种颜色或是字体的话，却是爱莫能助的。但现在，这种不可能

02

能直接复制图片中文字，功能远超普通OCR软件，MIT学生开发了一款强大Chrome插件

有时你遇到一篇古老的文献，PDF文档还是扫描版。又或者是遇到一幅网页版海报，上面的文字你完全看不懂。

01

走进AI时代的文档识别技术之文档重建

导读：作者系腾讯QQ研发中心——CV应用研究组的totoralin。本文主要介绍基于深度学习的文档重建框架，通过文档校正、版面分析、字体识别和阅读排序将纸质文档智能转成可编辑的电子文档。相比较传统的OCR技术，更加完整地恢复出文档关键图表等内容，提高用户文档处理的效率。 1、相关背景随着知识爆炸，借助纸质媒体、网络媒体等途径每天我们都在接触大量的信息。但是当我们发现某些信息是有启发性、有价值的，又苦于如何将这些信息沉淀下来。由于这些信息载体丰富多样，有的是纸质书有的是网页报道有的是PDF电子书，没有

06

深入浅出了解OCR识别票据原理

光学字符识别技术（OCR）目前被广泛利用在手写识别、打印识别及文本图像识别等相关领域。小到文档识别、银行卡身份证识别，大到广告、海报。因为OCR技术的发明，极大简化了我们处理数据的方式。

03

优Tech分享 | 通用文字识别的问题和算法

图像文字作为信息传递的重要载体，图像文字识别对于高效化办公，场景理解等有着重要的意义。

03

深入浅出了解OCR识别票据原理

本文介绍了如何通过光学字符识别（OCR）技术来识别收据中的文本内容，并探讨了在识别过程中可能遇到的文本噪声问题，以及如何解决这些问题。同时，文章还介绍了如何使用CNN和LSTM等深度学习技术来提高文本识别的准确率。

03

AI 字体世界地图：用 AI 和机器学习辨析各种字体的审美特征

【新智元导读】著名设计机构 IDEO 项目负责人 Kevin Ho 受到李飞飞高徒 Andrej Karpathy 做的“图像地图”的启发，用机器学习算法通过视觉特征对字体进行排序和分类，形成了一个“字体地图”，可以帮助设计人员更简单地发现具有相似审美特征的字体。机器学习都能干什么？太多了。比如本文的作者 Kevin Ho ( 著名设计机构 IDEO 项目负责人) 就发现一张让他印象深刻的图像。这张奇妙的图片地图是由李飞飞的高徒 Andrej Karpathy 使用 AI 图像识别技术将数千张照片统合形

05

AIGC席卷智慧办公，金山办公如何架构文档智能识别与理解的通用引擎？

如今，智慧办公是企业办公领域数字化转型的题中之义。作为国内最早开发的软件办公系统之一，金山办公如何应用深度学习实现复杂场景文档图像识别和技术理解？本文将从复杂场景文档的识别与转化、非文本元素检测与文字识别、文本识别中的技术难点等多个方面进行深度解析。作者 | 金山办公CV技术团队出品 | 新程序员在办公场景中，文档类型图像被广泛使用，比如证件、发票、合同、保险单、扫描书籍、拍摄的表格等，这类图像包含了大量的纯文本信息，还包含有表格、图片、印章、手写、公式等复杂的版面布局和结构信息。早前这些信息均采用

01

机器学习（二十四） ——从图像处理谈机器学习项目流程

机器学习（二十四）——从图像处理谈机器学习项目流程（原创内容，转载请注明来源，谢谢）一、概述这里简单讨论图像处理的机器学习过程，主要讨论的是机器学习的项目流程。采用的业务示例是OCR（photo optical character recognition，照片光学字符识别），通过一张照片，识别出上面所有带字符的内容。二、机器学习流水线对于一个业务项目，通常机器学习是其中一部分的内容，对于整个项目而言，相当于一个流水线(pipeline)。对于OCR，主要流水线为：1-获取照片->2-字符串

05

深度学习CTPN+CRNN模型实现图片内文字的定位与识别(OCR)

源码（PyTorch实现）github 地址：在公众号 datadw 里回复 OCR 即可获取。 1:样本获取 **算法论文:** Synthetic Data for Text Localisation in Natural Images Github: https://github.com/ankush-me/SynthText **词库:** https://pan.baidu.com/s/10anmu + 英文词汇经过处理后得到大约500兆 6

05

文档比对技术难点与使用场景

文档比对技术是一种用于比较两份文档之间差异的先进技术。具备较大的技术难点和场景价值。下面将对其技术难点和使用场景进行详细探讨。

02

场景文字识别技术，过滤黄赌毒

作者介绍：数据平台部OCR+团队负责人。2008年毕业于中国科学院研究生院，主攻模式识别、计算机视觉、图像处理、以及深度学习等方向。读研期间曾在模式识别顶级期刊PAMI（IEEE Transactions on Pattern Analysis and Machine Intelligence）发表指纹识别相关论文。此前在腾讯优图团队从事图像处理（人脸识别）相关工作，现在属于腾讯技术工程事业群\数据平台部\OCR+团队，主要从事文字识别、图像语义理解等相关工作。引言 OCR技术，通俗来讲就是从图像中

【Dev Club 分享】深度学习在 OCR 中的应用

Dev Club 是一个交流移动开发技术，结交朋友，扩展人脉的社群，成员都是经过审核的移动开发工程师。每周都会举行嘉宾分享，话题讨论等活动。本期，我们邀请了腾讯 TEG 技术工程师“文亚飞”，为大家分享《深度学习在OCR中的应用》。下面是分享实录整理： ---- 大家好，我是文亚飞，来自腾讯TEG，目前负责图像识别相关的工作。OCR（光学字符识别）旨在从图片中检测和识别文字信息，本次分享将介绍我们在OCR技术研发过程中的一些方法和经验总结。一，OCR背景及基本框架介绍 OCR技术从上世纪60年代就开

08

用Python机器学习搞定验证码

写爬虫有一个绕不过去的问题就是验证码，现在验证码分类大概有4种：图像类滑动类点击类语音类今天先来看看图像类，这类验证码大多是数字、字母的组合，国内也有使用汉字的。在这个基础上增加噪点、干扰线、变形、重叠、不同字体颜色等方法来增加识别难度。相应的，验证码识别大体可以分为下面几个步骤：灰度处理增加对比度(可选) 二值化降噪倾斜校正分割字符建立训练库识别由于是实验性质的，文中用到的验证码均为程序生成而不是批量下载真实的网站验证码，这样做的好处就是可以有大量的知道明确结果的数据集。当

07

隐秘的印记：暗水印实践技术分享

暗水印我们可以理解为：在一些载体数据中添加隐藏标记，这些标记在人类和机器可轻易感知的范围之外。相较于常见的明水印，比如图片和视频中的公司logo、纸币中的水印纹理等。暗水印对大部分感知系统来说是透明的，不可见的。下面通过两个例子来说明。

08

马赛克还原神器—Depix，真的有那么神吗？「建议收藏」

第一步，作者在编辑器中使用了与原图(带有马赛克的图片)相同的字体设置（文本大小，字体，颜色等设置），然后将 debruinseq.txt 内的文字和数字放入编辑器中并截图，这张截图中的所有文字都将被像素化后作为“搜索集”来识别原图中马赛克的真实内容：

02

推荐一篇全网最全的爬虫及应对解决方案

爬虫是 Python 的一个常见应用场景，很多练习项目就是让大家去爬某某网站。爬取网页的时候，你大概率会碰到一些反爬措施。这种情况下，你该如何应对呢？本文梳理了常见的反爬措施和应对方案。

02

开发入门之Web 品质- 可读性

可读性是网站品质的重要方面，它直接影响用户的使用体验和网站的可维护性。因此，在设计和开发过程中应该注重提高网站的可读性。本文将介绍如何通过一些技术手段提高Web网站的可读性。

03

01. OCR 文字识别学习路径

由于最近在接触一些OCR的工作，所以本期《晓说AI》和大家分享一下我的一些总结，先从基本的概念讲起。如有错误，还请指正，谢你3千遍。如有疑问，欢迎留言，我会第一时间答复。

08

进击的反爬机制

反爬方与爬虫方相互博弈，不断制造爬取难度，或一定程度上阻止了爬虫行为。爬虫方也在不断更新技术，来对抗种种反爬限制。

02

woff字体图元结构剖析，自定义字体的制作与匹配和识别

前面我在2万字硬核剖析网页自定义字体解析（css样式表解析、字体点阵图绘制与本地图像识别等）一文中，讲解了通过图像识别来解析自定义字体，但是图像识别的缺点在于准确率并不能达到100%，还需要二次修改。

02

MATLAB实现OCR识别数字和字符

OCR也叫做光学字符识别，是计算机视觉研究领域的分支之一。它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来，并转换成一种计算机能够接受、人又可以理解的格式。

04

OCR技术在爱奇艺的应用实践及演进

随着人工智能的热度上升，图像识别这一细分领域也渐渐被人们所关注。在很多公司的业务中，有很多需要对图片进行识别的需求。为了帮助业务实现对这些图片、文档的识别和结构化，业界进行了一系列的实践和探索，最终确定了一些可行的方法。实践过程中，可能遇到过一系列问题和难点。本次直播分享，我们将结合目前的业务需求，说说爱奇艺在探索中遇到的痛点和难点以及识别技术中的一些细节。

02

康耐视深度学习VIDI介绍（1）

前几天康耐视举行了一次线上分享会，主要是对2022年他们新产品的一些介绍和老产品的更新说明。我抽时间听了一下给我的感觉是康耐视现在基本上是在all in AI，他们传统的视觉算法和平台基本上没有太大的变化，但是在AI产品这一块丰富了很多。

03

学界 | 清华大学提出SA-VAE框架，通过单样本/少样本学习生成任意风格的汉字

选自arXiv 作者：Danyang Sun等机器之心编译参与：Nurhachu Null、刘晓坤近日，清华大学提出了一种风格感知变分自编码器（SA-VAE），通过引入先验知识，结合少量的样本学

攻击生物识别验证，可以分哪几步？

刷脸乘车、刷脸支付、刷脸解锁手机......从钱包到手机，这一次干脆彻底解放。生活中似乎不会再有忘带现金、忘记密码的尴尬，因为没有人出门会忘记”带脸“。现实真魔幻，很快在中国什么都可以刷脸了。然后呢？ AI 技术的曲折发展，宛若一个经历了大起大落、终磨一剑的绝世高手，坚守半世纪终于再次获得尊重。但是，那些招数又能否经得起现实的考验？什么是生物识别验证？在探讨生物识别验证领域中的 AI 攻防之前，我们先了解一下：什么是生物识别验证。 “验证”表示“满足规定要求”，通常可能出现以下几种情况： W

07

【AIDL专栏】白翔：基于合成数据的场景文本深度表示方法

目前的文字识别主要有两方面的研究。首先是传统的文字识别，也就是文档中的文字识别，主要是OCR技术，其技术已经比较成熟，效果也比较稳定。另一方面是基于场景的文字识别，也就是图片中的文字识别，即将图片里的文字转化成人类可以理解的语言。这个过程需要实现以下目标：获得图片中文字出现的位置，包括文本的起始位置、结束位置和上下高度；将所在位置的图片所包含的文本数据转化成人们可以理解的信息。这整个过程就是文字识别。

03

论文精读| 附源代码及数据集 | LeCun的CNN经典之作 | Gradient-Based Learning…

Yann LeCun，生于1960年，是一位机器学习、计算机视觉、机器人、计算神经科学领域的计算机科学家。他被大家所熟知的是在非光学字符识别和利用卷积神经网络（CNN）实现计算视觉方面的工作，是CNN之父。他也是DjVu图像压缩技术的主要创造者之一。他与Léon Bottou.共同开发了Lush编程语言。

02

【文本检测与识别-白皮书】第一章：技术背景

OCR全称Optical Character Recognition，即光学字符识别，最早在1929年被德国科学家Tausheck提出，定义为将印刷体的字符从纸质文档中识别出来。现在的OCR，狭义上指对输入扫描文档图像进行分析处理，识别出图像中文本信息。而随着OCR技术的日益发展，人们已不再仅仅满足于文档或书本上的文本，开始将目标转移到现实世界场景中的文本，这被称为场景文本识别（Scene Text Recognition，STR）。

02

对比几家比较优质的PDF转Word SDK

Hello 大家好，我是Youna。我们打工人平时办公免不了要对一些文档格式行转换。我们将探讨几款主流的 PDF 转 Word SDK，分析它们在我们打工人的实际工作中所呈现的优势与劣势。

01

腾讯数平精准推荐 | OCR技术之识别篇

本文介绍了腾讯数平精准推荐团队的OCR识别算法，包括识别算法的演进之路以及4个代表性方法。

OCR检测与识别技术

在过去的数年中，腾讯数平精准推荐(Tencent-DPPR)团队一直致力于实时精准推荐、海量大数据分析及挖掘等领域的技术研发与落地。特别是在广告推荐领域，团队自研的基于深度在线点击率预估算法及全流程实时推荐系统，持续多年在该领域取得显著成绩。而在用户意图和广告理解上，借助于广告图片中的文本识别以及物体识别等技术手段，可以更加有效的加深对广告创意、用户偏好等方面的理解，从而更好的服务于广告推荐业务。 OCR（Optical Character Recognition, 光学字符识别）是指对输入图像进行分析识

AI说：你的书法有咖喱味丨看字识国别

郭一璞发自凹非寺量子位报道 | 公众号 QbitAI 在电影《大侦探福尔摩斯》中，福尔摩斯能够根据两个英文字母的笔迹，判断书写者的才能与性格特点，识破对手的伪装。如此神奇的笔迹理论听起来像

02

模式识别新研究：微软OCR两层优化提升自然场景下的文字识别精度

鼠标发明人Douglas Engelbart曾经针对人工智能的简称AI提出了另一个理念——Augmented Intelligence，即增强智能。在他看来，人已经足够聪明，我们无需再去复制人类，而是可以从更加实用的角度，将人类的智能进一步延伸，让机器去增强人的智能。 OCR （Optical Character Recognition，光学字符识别）就是这样的一项技术，它的本质上是利用光学设备去捕获图像并识别文字，将人眼的能力延伸到机器上。本文将介绍OCR技术在移动环境下面临的新挑战，以及在自然场景图像下

05

机器学习：应用示例–图片OCR.md

图像文字识别应用所作的事是，从一张给定的图片中识别文字。这比从一份扫描文档中识别文字要复杂的多。

03

使用numpy和opencv实现文档图像的去水印功能

在做文档图像的OCR时，经常会遇到水印的问题，会导致文字检测与识别很容易出错，因此，去水印的功能非常有必要。我们在实现去水印的过程中，经历了几个版本，今天做一个回顾：

02

可视化与编辑器，不至是代码~ | MixAI 知识库 No.57

Note-taking for better thinking.是这款工具所提倡的思想

01

机器学习解锁古日本时代！KuroNet轻松阅读古草体

人类历史进程中留下的大量历史文献和文物，而随着当时的语言文字消逝，尽管这些文档包含了对现代文化遗产至关重要的历史传说记载，对于普通读者而言连基本的“读懂”都无法做到。

01

2019年末逆向复习系列之从猫眼字体反爬分析谈谈字体反爬的前世今生

这篇文章是公众号《云爬虫技术研究笔记》的《2019年末逆向复习系列》的第六篇：《从猫眼字体反爬分析谈谈字体反爬的前世今生》

02

打印的条码总扫不出来，赵总有点上火，瓜哥出完手就不见了，竟然去抢菜了

社群分享实录昨天赵总在群里遇到foxbarcode在win10中打印预览，显示是条码是正常的。实际打印出来，就是变形的。他一直以为是条码打印机的问题，反复折腾了很久。最后做了两个条码在一个报表中打印出来。对比结果，感觉是函数输出的问题。

02

2019年末逆向复习系列之从猫眼字体反爬分析谈谈字体反爬的前世今生

这篇文章是公众号《云爬虫技术研究笔记》的《2019年末逆向复习系列》的第六篇：《从猫眼字体反爬分析谈谈字体反爬的前世今生》

03

苹果推出高精度手写识别系统，可准确识别3万字符集

安妮编译自苹果机器学习博客量子位出品 | 公众号 QbitAI 在手机、平板和可穿戴设备不断普及的今天，手写识别比以往任何时候都重要。但这并非易事，拿汉字来说，让移动设备识别大量手写汉字字符还是个挑战。今天，苹果机器学习博客发表文章《Real-Time Recognition of Handwritten Chinese Characters Spanning a Large Inventory of 30,000 Characters》，介绍了苹果如何在iPhone、iPad和Apple Wat

07

场景文本检测—CTPN算法介绍

原创声明：本文为 SIGAI 原创文章，仅供个人学习使用，未经允许，不得转载，不能用于商业目的。

06

Python | 用机器学习搞定数字验证码，还有谁？！

来源：http://www.hi-roy.com/2017/09/19/Python验证码识别

06

Github：深度学习文本检测识别（OCR）精选资源汇总

今天跟大家推荐一个Github项目，来自NAVER Clova AI Research的hwalsuklee同学汇总了近几年的基于深度学习进行文本检测、识别的论文、代码、数据集、教程资源，非常值得参考。

03

第十九章应用实例：图片文字识别(Application Example: Photo OCR)

图像文字识别应用所作的事是，从一张给定的图片中识别文字。这比从一份扫描文档中识别文字要复杂的多。

04

三年磨一剑——微信OCR图片文字提取

导语 | 2021年1月，微信发布了微信8.0，这次更新支持图片文字提取的功能。用户在聊天界面和朋友圈中长按图片就可以提取图片中文字，然后一键转发、复制或收藏。图片文字提取功能基于微信自研OCR技术，本文将介绍微信OCR能力是如何落地文字提取业务的。文章作者：伍敏慧，腾讯WXG研发工程师。一、背景微信8.0上线了图片提取文字的功能，用户在聊天界面和朋友圈中如果想提取图像中的文字，不用再辛苦打字了，只要简单几个步骤，就可以拿到图片中的文字内容，超级方便实用。图1 微信客户端提取图片中的

05

美团的OCR方案介绍

近年来，移动互联、大数据等新技术飞速发展，倒逼传统行业向智能化、移动化的方向转型。随着运营集约化、数字化的逐渐铺开，尤其是以OCR识别、数据挖掘等为代表的人工智能技术逐渐深入业务场景，为用户带来持续的经济效益和品牌效应。图书情报领域作为提升公共服务的一个窗口，面临着新技术带来的冲击，必须加强管理创新，积极打造智能化的图书情报服务平台，满足读者的个性化需求。无论是高校图书馆还是公共图书馆，都需加强人工智能基础能力的建设，并与图书馆内部的信息化系统打通，优化图书馆传统的服务模式，提升读者的借阅体验。

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭