首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

弯曲文字检测之SPCNet

文字检测在深度学习的推动下,最近几年取得了长足的进步。由于多媒体检索,工业自动化,视力障碍人士辅助设备等应用的需求日益增长,场景文本检测是的计算机视觉的热门研究话题之一。给定一张自然场景图像,定位出图中的所有文字的位置,即场景文本检测的目标。过去的大多数文章主要集中于检测水平文字和倾斜文字,主要数据集也是基于水平文字和倾斜文字的,然而,自然场景中大量存在弯曲文本。因此本文提出一种方法,不仅可以检测水平和多方向文字,同时可以检测弯曲文字,对各种形状的文字检测都十分鲁棒。同时,本文还提出两个模块,可以有效抑制错误样本的检测。该文章被AAAI2019收录。

05

AIGC席卷智慧办公,金山办公如何架构文档智能识别与理解的通用引擎?

如今,智慧办公是企业办公领域数字化转型的题中之义。作为国内最早开发的软件办公系统之一,金山办公如何应用深度学习实现复杂场景文档图像识别和技术理解?本文将从复杂场景文档的识别与转化、非文本元素检测与文字识别、文本识别中的技术难点等多个方面进行深度解析。 作者 | 金山办公CV技术团队 出品 | 新程序员 在办公场景中,文档类型图像被广泛使用,比如证件、发票、合同、保险单、扫描书籍、拍摄的表格等,这类图像包含了大量的纯文本信息,还包含有表格、图片、印章、手写、公式等复杂的版面布局和结构信息。早前这些信息均采用

01

IENet: Interacting Embranchment One Stage Anchor Free Detector

航空图像中的目标检测是一项具有挑战性的任务,因为它缺乏可见的特征和目标的不同方向。目前,大量基于R-CNN框架的检测器在通过水平边界盒(HBB)和定向边界盒(OBB)预测目标方面取得了显著进展。然而,单级无锚解仍然存在开放空间。提出了一种基于逐像素预测检测器的航空图像定向目标单级无锚检测器。我们通过开发一个具有自我注意机制的分支交互模块来融合来自分类和框回归分支的特征,从而使它成为可能。在角度预测中采用几何变换,使预测网络更易于管理。我们还引入了一种比正多边形借条更有效的借条损耗来检测OBB。在DOTA和HRSC2016数据集上对所提出的方法进行了评估,结果表明,与最先进的检测器相比,我们所提出的IENet具有更高的OBB检测性能。

01
领券