自然场景文字识别技术及在地图中的应用

  • 回答 (11)
  • 关注 (0)
  • 查看 (680)

 随着互联网和移动互联网技术的高速发展,越来越多的新型应用场景需要利用自然场景图像中的文字信息。

小狼小狼提问于
不不个了路遙知馬力 日久見人心。回答于
推荐

地图文本识别技术创新

        1) 卷积过程基于GoogLeNet的Inception 结构进行改进,采用不同大小的卷积核意味着不同大小的感受野,最后拼接不同尺度特征,提升网络性能。

        2)修改解码方式,支持多候选和文字位置的输出,校正识别结果。如图输出每个字符位置所示,模型识别结果为:粮粮油调料干菜批发部,根据两个“粮”字的中线距离较近可以判断这两个字符是同一个字符,调整识别结果为:粮油调料干菜批发部。

输出每个字符位置:

输出多个识别结果候选:

       3)超分辨率技术扩增训练样本,极大的提高了低分辨率样本的识别率。

圣才码农回答于

地图OCR在POI众包中的应用

      1.众包用户采集POI图片上传到众包后台进入采编分离环节,采编分离算法根据OCR的文本检测结果剔除没有POI的图片;有POI的图片根据OCR识别结果自动编辑图片对应的POI,编辑成功的POI完成审核;没有编辑成功的POI进入人工去噪。

     2.人工去噪把没有POI的图片剔除,有POI的图片返给众包用户编辑POI。

     3.用户编辑的图片和POI上传到众包后台进入自动审核,自动审核根据OCR识别结果与用户编辑的POI进行匹配,匹配上的POI完成审核,没匹配上的POI进入人工审核。

      4.人工审核通过的POI完成审核,没通过的POI剔除。

      POI众包通过应用地图OCR技术及采编分离流程对业务的帮助有几下几点:

     1.采编分离环节自动剔除的没有POI的图片节省了众包用户查看图片时间,自动编辑上POI的图片节省了用户的编辑时间。众包用户总的查看编辑POI的时间降低了58%,大大提高了用户的作业效率,提升了用户体验及用户黏性。

     2.通过采编分离流程及新的定价策略使POI的回收率提高了83%,增强了POI数据的完备性。

     3.自动审核通过的POI可以直接入库,不用审核员再查看,大大解放了人力,提升了审核效率,节省了成本。

djgump回答于

文字识别方法主要分为单字识别和文本行识别。

       1.单字识别,是将文字识别看成分类问题,用CNN代替了传统文字识别方法中特征提取步骤,显而易见,此方法需要使用固定大小的单字图像作为输入,也就是识别之前要定位每个字符的位置。此方法会将字符定位的误差带入识别环节,影响整个文字识别系统的准确率。

       2.文本行识别,通用识别算法是CRNN网络,此方法结合基于CNN的图像特征和基于RNN的上下文特征取代人工定义的特征,并且避免了字符分割,实现端到端的无约束字符定位和识别,能较好地识别自然场景文字。

游王子讴歌灬简单而丰富回答于

我来举个例子吧~

地图公交数据的更新过程数据审核流程如下:

       1.众包用户采集线路站牌图像并编辑站点名称及线路ID上传到众包后台自动审核环节。

       2.自动审核算法通过OCR结果及线路ID找出图像中的目标线路,并将识别出的该线路的站点与用户编辑的站点进行对比,差分出没匹配上的站点进入人工审核,匹配上的站点完成审核。

       3.人工审核界面如图15所示,粉色框内是用户编辑列表,蓝色框是算法识别结果匹配上的站点列表,红色箭头处是没有匹配上的站点,站牌图像中的红框部分是目标线路站点,绿色框是匹配上的站点,结合用户编辑列表中红色箭头处的站点和站点图像上没有框绿框的站点,审核员可以快速定位并审核需要人工审核的站点。

     公交众包通过应用地图OCR技术,由之前的全人工审核实现了69%的站点不用人工审核,机器自动审核入库,在保证审核质量的前提下大大提高了审核效率。

青蛙克星哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈回答于

相对于传统的测绘采集,众包数据采集具有成本低、速度快、覆盖广等优点,正逐渐成为地图数据更新的主要方式。众包采集的数据包括轨迹数据和图像数据两部分,其中图像数据的规模非常庞大(数亿),纯粹依靠人工的信息比对、处理耗时耗力,文字识别技术确实比较符合要求。顶!

黄易音乐战组程序员回答于

地图自然场景文字识别技术

      地图众包图片具有多方向性,几何畸变,图像退化,及图片中文字的排版复杂,尺度多样等特性

幽幽77IT从业者回答于

自然场景文字识别的背景复杂,照片拍摄时的抖动,以及低分辨率、强光、阴影、噪声、艺术字、排列方式、模糊和遮挡等情况都给自然场景文字识别带来了很大的挑战。早先的传统文字识别方法基本都采用基于模板匹配的方式,此类技术针对自然场景下的文字识别几乎不起作用。目前自然场景文字识别中主流的实时方法有MSER和SWT方法,但存在很多漏检情况,比如处理不了背景和文字对比度很低的情况。

帅的惊动我国计算机大神回答于

自然场景文字识别在地图中可以用于自动提取众包图像中的店招、路牌、公交站牌等文字信息,用途广泛啊,值得深度学习。

芜湖服务真实姐真是真实找到富商大贾发生的股份回答于

一张合适的底图配上逗比的文字往往比冰冷的文字更加能表达当时的一个心理状态。

一般搜索方式就是用户根据文字找到想要的表情。

倩倩威武只想写一辈子Java的单身狗回答于
用户3127057回答于

所属标签

可能回答问题的人

  • Y. Ji

    5 粉丝0 提问1 回答
  • Superbeet

    4 粉丝0 提问0 回答
  • 腾讯云AI中心

    腾讯云 · 产品经理 (已认证)

    62 粉丝0 提问19 回答
  • 莫烦

    2 粉丝0 提问0 回答
  • 罗罗可爱多

    腾讯 · 高级研究员 (已认证)

    9 粉丝0 提问4 回答
  • 晏栋栋栋

    1 粉丝0 提问1 回答

扫码关注云+社区

领取腾讯云代金券