防止文本区域中的文本重叠_防止图像和文本重叠_如何防止文本重叠导航栏？ - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

ICCV2019 | 任意形状文本检测的像素聚合网络

本文简要介绍了2019年7月被ICCV录用的论文“Efficient and AccurateArbitrary-Shaped Text Detection with Pixel Aggregation Network”的主要工作。该论文主要解决了自然场景文本检测中的两个问题：一是如何权衡在自然场景任意形状文本检测的速度与精度，二是不规则文本的精准检测。

00

MSER+NMS检测图像中文本区域

OCR相关工作都有一个第一步，那就是检测图像中的文本区域，只有找到了文本区域，才能对其内容进行识别，也只有找到了文本区域，才能更有针对性地判断该文本图像的质量好坏，我们期望达到如下的文本区域检测效果：

01

您找到你想要的搜索结果了吗？

是的

没有找到

FOTS：端到端的文本检测与识别方法的理论与应用

目前的主流算法也可以分成单阶段和两阶段两大类两阶段的方法都是基于目标检测和实例分割中常用的算法Faster R-CNN 和Mask R-CNN。Li 等人(2017a)提出了第1个基于深度学习的端到端自然场景文本检测和识别算法，该方法基于Faster R-CNN 进行检测，将通过RoI-Pooling 提取的共享特征送入基于注意力机制(Attention)的识别器进行文本识别，但该方法只能检测识别水平方向的文本。Lyu 等人(2018b) 基于Mask R-CNN 提出了MaskTextSpotter，该方法在RoI-Align 之后额外增加了一个单字实例分割的分支，对文本的识别也是依赖于该分支的单字符分类。

02

Android 在任意位置绘制文本

转载请注明出处。请前往 Tiga on Tech 查看原文以及更多有趣的技术文章。

01

Human Interface Guidelines —— 搜索栏（Search Bars）

自上次参加完回音分享会后，我下定决心要洗心革面乖乖打基础，于是开启了这个part，争取两个月不间断更新，写完Material Design与iOS中的组件（顺便学学英语），以便今后在使用的时候完全不虚

08

【文本检测与识别-白皮书-3.1】第二节：基于分割的场景文本检测方法

像素级别的文本检测方法通常借鉴物体语义分割和实例分割的思想，利用全卷积神经网络(fully convolution network，FCN)(Long 等人，2015)对图像中的每个像素点进行文本和非文本分类，从而得到文本区域掩码图(Mask)。然后通过一些像素聚合的后处理方式将属于同一文本的文本像素点聚合在一起得到最后的文本实例边界框。

01

大盘点|OCR算法汇总

介绍了一种基于旋转的新颖网络框架，用于自然场景图像中面向任意方向的文本检测。论文的主要思想为旋转区域提案网络（RRPN），该网络旨在生成带有文本方向角度信息的倾斜proposal，并将角度信息用于边界框回归，以使proposal在方向方面更准确地适合文本区域。除此之外，还提出了旋转兴趣区域（RRoI）池化层，以将任意方向的proposal投影到feature map上供分类器进行分类。与以前的文本检测系统相比，基于region proposal的体系结构确保了面向任意方向的文本检测的计算效率。

01

【Android 应用开发】Canvas 精准绘制文字 ( 测量文本真实边界 | 将文本中心点与给定中心点对齐 )

获取的边界值 , 并不是绘制该文本的坐标 , 是使用 Paint 在 Canvas 中绘制的文本的真实占用区域 , 如下图红色矩形框所在的区域 , 与文本的相对坐标 , 下图的红色矩形框的右下角是 ( 0 , 0 ) 坐标位置 ;

02

教程 | Adrian小哥教程：如何使用Tesseract和OpenCV执行OCR和文本识别

本教程将介绍如何使用 OpenCV OCR。我们将使用 OpenCV、Python 和 Tesseract 执行文本检测和文本识别。

05

CTPN、TextBoxes、SegLink、RRPN、FTSN、DMPNet…你都掌握了吗？一文总结OCR必备经典模型（一）

本专栏将逐一盘点自然语言处理、计算机视觉等领域下的常见任务，并对在这些任务上取得过 SOTA 的经典模型逐一详解。前往 SOTA！模型资源站（sota.jiqizhixin.com）即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。

03

ComponentOne.NET仪表板布局控件 — 实现可视化数据大屏展示

.NET开发领域的总体趋势是互操作性，葡萄城全功能 .NET控件集 ComponentOne 在2018将延续这一趋势：无论是 .NET平台，ASP.NET Core，Xamarin还是未来计划中的XAML标准，互操作性是所有应用程序的关键，这也将作为我们未来产品规划的核心，我们将继续创新和加强现有产品。

02

Excel实战技巧70：仿Word的字数统计功能

在Word中，有一个“字数统计”功能（如下图1所示），可以统计文档或者所选文档区域中字数、字符数、行数、段落数等信息。

02

JavaSwing_8.1:焦点事件及其监听器 - FocusEvent、FocusListener

低级别事件指示Component已获得或失去输入焦点。由组件生成此低级别事件（如一个TextField）。该事件被传递给每一个FocusListener或FocusAdapter注册，以接收使用组件的此类事件对象addFocusListener方法。（ FocusAdapter对象实现FocusListener接口。）每个此类侦听器对象获取此FocusEvent当事件发生时。有两个焦点事件级别：持久性和暂时性的。永久焦点改变事件发生时焦点直接移动从一个组件到另一个，例如通过到requestFocus的（呼叫）或作为用户使用TAB键遍历组件。当暂时丢失焦点的组件的另一个操作，比如释放Window或拖动滚动条的间接结果一时焦点变化的事件发生。在这种情况下，原来的聚焦状态将被自动一旦操作完成恢复，或者，对于窗口失活的情况下，当窗口被重新激活。永久和临时焦点事件使用FOCUS_GAINED和FOCUS_LOST事件id传递; 水平可以使用isTemporary（）方法的事件区分开来。如果未指定的行为将导致的id任何特定的参数FocusEvent实例不是从范围FOCUS_FIRST到FOCUS_LAST

01

基于分割思想的文本检测算法

在文本检测任务中，较少出现字符重合的情况（重合的字符人也认不出来啊），所以基于分割思想的文本检测算法也能得到很好的效果。

02

CRAFTS：端对端的场景文本检测器

场景文本检测器由文本检测和识别模块组成。许多研究已经将这些模块统一为一个端到端可训练的模型，以获得更好的性能。一个典型的体系结构将检测和识别模块放置到单独的分支中，通常使用RoI pooling来让这些分支共享一个视觉特征。然而，当采用使用基于注意力的解码器和表示字符区域空间信息的检测器时，仍然有机会在模块之间建立更互补的连接。这是可能的，因为这两个模块共享一个共同的子任务，即查找字符区域的位置。

04

【文本检测与识别白皮书-3.2】第三节：常用的文本识别模型

2017年华中科技大学在发表的论文《An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition》提出了一个识别文本的方法，这种方法就是CRNN。该模型主要用于解决基于图像的序列识别问题，特别是场景文本识别问题。

03

SystemVerilog中scheduler（调度）

虽然设计的代码在仿真器中理论上来说是可以并行执行的，但是在实际仿真中，代码都是运行在CPU上的一些程序而已。SV为代码的执行顺序定义了调度机制，最大限度的减少不确定性的产生。

02

java Swing用户界面组件文本输入：文本域+密码域+格式化的输入域

现在终于可以开始介绍Swing用户界面组件了。首先，介绍具有用户输入和编辑文本功能的组件。文本域（JTextField）组件和文本区（JTextArea）组件用于获取文本输入。文本域只能接收单行文本输入而文本区可以接收多行文本输入。

01

怎样完成票据证件的关键信息抽取任务

文档版面分析是对图片或页面扫描图像上感兴趣的区域进行定位和分类的过程，版面分析的目的是让机器“看懂”文档结构，即将文档图像分割成不同类型内容的区域，并分析区域之间的关系，这是内容识别之前的关键步骤。从广义上讲，大多数方法可以提炼为页面分割和逻辑结构分析。

01

OpenHarmony实现倒计时效果

倒计时的效果在网站或其他平台看到的很多了吧，今天就让我们来看看在OpenHarmony中如何实现它吧！

02

前端小技能，10个基本组件的代码片段

点击上方蓝字“ITester软件测试小栈“关注我，每周一、三、五早上 09:00准时推送，每月不定期赠送技术书籍。

01

OSPF的五种区域类型

为了保证到自治系统外的路由可达，由该区域的ABR发布Type3缺省路由传播到区域内，所有到自治系统外部的路由都必须通过ABR才能发布。

02

最新 Navicat Premium 16 学习使用工具及使用教程

截至2022年9月，Navicat仍然是Windows系统上最好用的关系数据库的GUI客户端，当前最新版本是16。本文分享最新的Navicat Premium 16的使用教程，文中附使用工具下载

01

Human Interface Guidelines —— Buttons

自上次参加完回音分享会后，我下定决心要洗心革面乖乖打基础，于是开启了这个part，争取两个月不间断更新，写完Material Design与iOS中的组件（顺便学学英语），以便今后在使用的时候完全不虚 Buttons Human Interface Guidelines链接：Buttons Button 用于启动 app 的特定操作，它具有可自定义的背景，并且可以包含title或图标。系统为大多数使用情况提供了许多预定义的 button 样式。也可以设计完全自定义的按钮。 ---- System Bu

06

OSPF 高级特性

邻居之间传递的LSA报文，在OSPF一共有11种类型的LSA 再来，目前学习的是OSPFv2【针对IPv4】后续将学习OSPFv3【针对IPv6】其中OSPFv2只需要掌握6种即可

02

深度学习应用篇-计算机视觉-OCR光学字符识别[7]：OCR综述、常用CRNN识别方法、DBNet、CTPN检测方法等、评估指标、应用场景

OCR(Optical Character Recognition,光学字符识别)是指对图像进行分析识别处理，获取文字和版面信息的过程，是典型的计算机视觉任务，通常由文本检测和文本识别两个子任务构成。

00

浙江大学和海康威视提出：视频场景文本定位算法SVST（集成检测，跟踪和识别于一体）

【导读】本文分享一篇浙江大学和海康威视最新联合提出的视频场景文本定位（Video Scene Text Spotting）方向的算法：SVST（spotting video scene text）。之前CVer曾分享过场景文本检测相关的论文

02

文本检测算法EAST介绍

EAST由旷世科技于2017年发表在CVPR的关于自然场景文本检测的一篇文章。EAST是用来解决多方向文本检测的问题的一种思路。其核心思想体现在了以下几点。

02

OSPF技术点：STUB区域

STUB区域是一种可选的配置属性，但并不是每个区域都符合配置的条件。通常来说，STUB区域位于自治系统的边界，是那些只有一个ABR的非骨干区域。

01

JAVA入门学习十二

描述:利用JAVA的Graphical User Interface(图形用户接口)来进行实现展示GUI界面;

01

JAVA入门学习十二

描述:利用JAVA的Graphical User Interface(图形用户接口)来进行实现展示GUI界面;

01

日更系列：使用vim像IDE一样搜索替换文本

还比如说你通过vim的可视范围选择，通过CTRL + V ,使用方向键选择你要标注的文本区域，然后按‘:’ 会自动敲入 :'<,’> ，然后使用命令进行替换

FOTS：自然场景的文本检测与识别

我们需要从任何图像(包含文本)检测文本区域，这个图像可以是任何具有不同背景的东西。在检测到图像后，我们也必须识别它。

02

AlexNet做文档布局分析 (版面分析)&数据集

文档布局分析 (Document Layout Analysis) 是识别和分类文本文档的扫描图像中的感兴趣区域（RoI, Regions of Interest) 的过程。阅读系统需要从非文本区域分割文本区域，并按正确的阅读顺序排列。将文本正文，插图，数学符号和嵌入文档中的表格等不同区域（或块）的检测和标记称为几何布局分析。但文本区域在文档中扮演不同的逻辑角色（标题，标题，脚注等），这种语义标记是逻辑布局分析的范围。

06

Java中规模软件开发实训——简单的文本编辑器（代码注释详解）

前言：在现代社会中，计算器是我们生活中不可或缺的工具之一。它们可以轻松地进行各种数值计算，从简单的加减乘除到复杂的科学运算，为我们提供了快捷准确的计算结果。但你是否曾想过，我们可以亲手打造一个属于自己的计算器应用程序，体验计算世界的奇妙之旅？本文将带领你进入计算器应用程序的开发领域。我们将使用Java编程语言和Swing图形界面库，从零开始构建一个简单但功能强大的计算器应用程序。无论你是计算机科学专业的学生，还是对编程和应用开发感兴趣的爱好者，这个实践项目都将为你提供一个宝贵的机会来深入了解应用程序开发的流程和技术。

01

Mask TextSpotter v3 来了！最强端到端文本识别模型

近日 Mask TextSpotter v3 发布，代码已开源，论文 Mask TextSpotter v3: Segmentation Proposal Network for Robust Scene Text Spotting 详细介绍了其要解决的问题、使用的方案和达到的性能，此次更新依然带来惊喜，在多个数据集上大幅刷新了SOTA！

01

玩转基因组浏览器之使用IGV查看基因结构信息

基因结构是最基本的基因组注释信息，通常情况下，我们最关心基因区域内的数据分布情况，有多种文件格式可以存储基因结构信息

02

扩展HT for Web之HTML5表格组件的Renderer和Editor

根据给定的文章内容，撰写摘要总结。

07

扩展HT for Web之HTML5表格组件的Renderer和Editor

在HT for Web提供了一下几种常用的Editor，分别是： slider：拉条 color picker：颜色选择器 enum：枚举类型 boolean：真假编辑器 string：普通的文本编辑器除了这几种常用编辑器之外，用户还可以通过继承ht.widget.BaseItemEditor类来实现自定义编辑器。而渲染器，在HT for Web提供常用的Renderer有： enum：枚举类型 color：颜色类型 boolean：真假渲染器 text：文本渲染器和编辑器一样也可以自定义渲染器，但是

03

Spread for Windows Forms高级主题(5)---数据处理

使用表单的API处理数据你可以将数据以有格式或无格式字符串或者数据对象的形式填充到单元格中。将数据填充到单元格的最好方式取决于你想添加字符串数据还是数据对象，以及你想添加数据到单一的单元格还是某个范围内的所有单元格。举例来说，如果你使用的数据来自用户的文本框中，你可能想要添加由Spread控件解析的字符串数据。如果你想要添加多个值，并想要直接将它们添加到数据模型中，可以以对象的方式添加它们。下表汇总了在表单级别添加数据的方法。数据描述单元格数目方法名具有格式的字符

09

python基础教程：作用域和命名空间

命名空间和作用域的概念我们之前也提到过，比如内置函数globals()，函数中变量的作用域，模块使用的import等等。这些可能让我们对这两个概念有了大致的理解。本节再详细探讨一下。

04

【积水成渊】9 个CSS 伪元素

伪::selection元素以用户选择的文本部分为目标。它提供了一种将样式应用于所选文本并自定义其外观的方法。这是一个例子：

03

一文学会所有 Android TextView 属性，妈妈再也不担心我的代码写不好了！

Android 中我们知道有一个使用频率非常高的控件，它就是 TextView，但是它的属性特别多，今天我们就来探究下，它都有哪些属性。

02

ICDAR 2019表格识别论文与竞赛综述（上）

表格作为一种有效的数据组织与展现方法被广泛应用，也成为各类文档中常见的页面对象。随着文档数目的爆炸性增长，如何高效地从文档中找到表格并获取内容与结构信息即表格识别，成为了一个亟待解决的问题。ICDAR是一个专注于文档分析与识别问题的国际学术会议，已经连续多届设置了表格识别专题。在今年的ICDAR 2019会议上，有不少研究者在表格检测与结构识别等领域做出了新的贡献，使其有了新的进展。本课题组梳理了该会议中有关表格识别的16篇论文，总结该领域当前的研究进展与挑战。同时，值得注意的是，该会议也举办了关于表格检测与结构识别的比赛，我们对参赛队伍使用的方法与结果进行了一些讨论。

07

Android TextView 属性大全

Android 中我们知道有一个使用频率非常高的控件，它就是 TextView，但是它的属性特别多，今天我们就来探究下，它都有哪些属性。

03

【Android 应用开发】Canvas 精准绘制文字 ( 文本边界坐标解析 | 绘图位置 )

在上一篇博客【Android 应用开发】Canvas 精准绘制文字 ( 测量文本真实边界 | 将文本中心点与给定中心点对齐 ) 中 , 简要介绍了 Paint.getTextBounds() 函数获取的 Rect 边界 , 今天补充下精准的绘图信息 ;

01

QUIC DataChannels的第一步

原文 https://webrtchacks.com/first-steps-with-quic-datachannel/

02

Jenkins 2.o Pipeline基本介绍

我们如果要明白Jenkins的使用和配置。那么流水线是不得不了解的知识。否则我们只是单纯的在模仿其他人配置的脚本，而不明白其中的实现逻辑和意义。

03

OCR技术的昨天今天和明天！2023年最全OCR技术指南！

OCR是一项科技革新，通过自动化大幅减少人工录入的过程，帮助用户从图像或扫描文档中提取文字，并将这些文字转换为计算机可读格式。这一功能在许多需要进一步处理数据的场景中，如身份验证、费用管理、自动报销、业务办理等都显得尤为实用。现如今，OCR解决方案会结合AI（人工智能）和ML（机器学习）技术，以自动化处理过程并提升数据提取的准确性。本文将介绍该技术的前世今生，一览该技术的阶段性发展：传统OCR技术统治的过去，深度学习OCR技术闪光的现在，预训练OCR大模型呼之欲出的未来！

00

无惧图像中的文字，TextDiffuser提供更高质量文本渲染

近几年来，Text-to-Image 领域取得了巨大的进展，特别是在 AIGC（Artificial Intelligence Generated Content）的时代。随着 DALL-E 模型的兴起，学术界涌现出越来越多的 Text-to-Image 模型，例如 Imagen，Stable Diffusion，ControlNet 等模型。然而，尽管 Text-to-Image 领域发展迅速，现有模型在稳定地生成包含文本的图像方面仍面临一些挑战。

03

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭