智能云上手指南:2000万运单快速识别背后

6月21日,腾讯云在2017「云+未来」峰会上推出了战略新品——智能云,宣布将腾讯积累近20年的AI能力向政府、企业和开发者开放,其中首批开放计算机视觉、智能语音识别、自然语言处理的三大核心能力。腾讯云技术社区将陆续推出系列文章,介绍普通开发者如何快速接入并使用这三大 AI 能力。

在峰会上,腾讯云总裁邱跃鹏提到:顺丰使用腾讯云开发的计算视觉能力,能在3小时识别2000万张快递手写运单。这背后的技术究竟是怎么实现的呢?

本文将以一张快递运单为例,为开发者介绍腾讯云开放的计算视觉能力——万象优图,是如何快速识别快递运单的。

1. 背景

随着电子商务的不断发展,线上线下商业模式已经密不可分,其中物流起着至关重要的作用。从商家到买家、从厂家到商家,都需要通过物流来完成。通过了解发现:一件商品从揽收到送达中间要经过多个环节,其中打包中转这一环节最为繁忙,也最为重要。为了提高该环节效率,需要更加快速的识别运单上的物流信息。万象优图的运单内容自动识别,将极大的促进了这一环节的稳定高效运作。

2. 万象优图运单识别

下面是一张常见的某快递单,其中收件人地址和收件人电话是非常关键的信息,物流中转完全依赖这两个信息的完整性。

传统的运单扫描都是靠人工肉眼识别的,成本高且效率低。因此探索人工智能是否可以自动扫描运单,具有非常大的意义。

下面将为您详细介绍万象优图运单识别的流程。

  • 运单版式识别每个快递公司的运单都有不同的版式。通过大数据分析和深度学习训练,使用模式匹配方法,找出不同版式运单的特征。如下图所示,在已知版式的情况下,可以根据版式解析出图片中固定区域的内容。
  • 字段定位

字段定位是针对收件人或寄件人的具体字段的区域检测,如电话号码、地址信息等。通过大量样本的训练,不断学习和适应各种运单中的版面变化、字体多样性变化、容忍各种噪声干扰等,最终训练得到准确性和稳定性非常强的字段定位的算法。字段定位效果示例如下图所示:

  • 电话号码识别运单上的电话号码通常是指11位的手机号或者8位的固定电话,基本上都是以整行的方式出现。通过长期的积累和对该场景的深入分析研究,万象优图提供了一套业内先进的整行识别技术,无需切分单字,直接识别整行手写字符。
  • 地址信息识别

针对地址场景,结合运单的具体需求,我们提供独创的地址信息识别方案。借鉴数字整行识别的方法,并针对省市区地址特征和手写文本特征,改进了识别网络,使其能够适应整行手写汉字的图像特点,并直接给出对应的省市区分类结果。整个地址识别流程简化成可以直接。

原创声明,本文系作者授权云+社区-专栏发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏PPV课数据科学社区

一步步教你如何入门精益数据分析!

目录 一、认识数据——产品经理与数据分析 1.1 数据的客观性 1.2 面对数据的智慧 1.3 数据分析中的误区 二、获取数据——...

1998
来自专栏数据科学与人工智能

【数据分析】高级数据分析方法之——RFM模型进行用户细分

1、根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有三个神奇的要素,这三个要素构成了数据分析最好的指标:最近一次消费(Recency)、...

2489
来自专栏企鹅号快讯

语音识别类产品的分类及应用场景

前言:本文作者@焦糖玛奇朵,是我们“AI产品经理大本营”早期成员,下面是她分享的第1篇文章,欢迎更多有兴趣“主动输出”的朋友们一起加入、共同进步:) ? 音频由...

25210
来自专栏AI科技评论

苹果开放机器学习API,但是没有看到苹果的机器学习开发平台

AI科技评论消息,今天凌晨的苹果WWDC主题演讲无疑是果粉的狂欢,它很有可能被捧为最棒的WWDC。这次大会苹果有6大更新,包括了iOS 11、新macOS、升级...

3036
来自专栏程序员互动联盟

【答疑释惑第四讲】如何学习人工智能?

疑惑一 如何学习人工智能? 很多人问如何学习这个,坦白说这个课题很大,用很小的篇幅也难说清楚,主要是人工智能涉及的领域以及专业知识太庞大,涉及到的不仅仅是编程知...

2836
来自专栏超智能体

为什么你会觉得编程、写作、解题时毫无头绪

433
来自专栏华章科技

涨姿势,14个复杂数据可视化的奇妙例子(译)

根据IDC数据,2015年全球数据量的年增长率可达到5.6泽字节(即5.6万亿兆字节),是2012年增长率的两倍。

651
来自专栏区块链资讯

使用BCH提供的Cryptonize创建自己的加密代币

在过去的几个月里,比特币以现金为动力的代币资产的想法一直处于许多讨论的前沿。到目前为止,在过去的几周里,我们已经看到了一系列代表性的代币创建平台,比如Bitma...

735
来自专栏量子位

来Google演奏一曲,以从未有过的音色 (Demo+Paper+Code)

若朴 发自 凹非寺 量子位 报道 | 公众号 QbitAI 上个月,Google公布了NSynth神经网络音频合成技术的细节。量子位在此前的报道里也有所提及。现...

3206
来自专栏大数据

数据到信息到知识到智慧

数据到信息到知识到智慧 这是大数据时代,这是人工智能时代,这是一个数据驱动一切的时代。 中文确实博大精深,大家都在说大数据,说数据挖掘,说知识图谱,说人工智能。...

1847

扫码关注云+社区