智能云上手指南:2000万运单快速识别背后

6月21日,腾讯云在2017「云+未来」峰会上推出了战略新品——智能云,宣布将腾讯积累近20年的AI能力向政府、企业和开发者开放,其中首批开放计算机视觉、智能语音识别、自然语言处理的三大核心能力。腾讯云技术社区将陆续推出系列文章,介绍普通开发者如何快速接入并使用这三大 AI 能力。

在峰会上,腾讯云总裁邱跃鹏提到:顺丰使用腾讯云开发的计算视觉能力,能在3小时识别2000万张快递手写运单。这背后的技术究竟是怎么实现的呢?

本文将以一张快递运单为例,为开发者介绍腾讯云开放的计算视觉能力——万象优图,是如何快速识别快递运单的。

1. 背景

随着电子商务的不断发展,线上线下商业模式已经密不可分,其中物流起着至关重要的作用。从商家到买家、从厂家到商家,都需要通过物流来完成。通过了解发现:一件商品从揽收到送达中间要经过多个环节,其中打包中转这一环节最为繁忙,也最为重要。为了提高该环节效率,需要更加快速的识别运单上的物流信息。万象优图的运单内容自动识别,将极大的促进了这一环节的稳定高效运作。

2. 万象优图运单识别

下面是一张常见的某快递单,其中收件人地址和收件人电话是非常关键的信息,物流中转完全依赖这两个信息的完整性。

传统的运单扫描都是靠人工肉眼识别的,成本高且效率低。因此探索人工智能是否可以自动扫描运单,具有非常大的意义。

下面将为您详细介绍万象优图运单识别的流程。

  • 运单版式识别每个快递公司的运单都有不同的版式。通过大数据分析和深度学习训练,使用模式匹配方法,找出不同版式运单的特征。如下图所示,在已知版式的情况下,可以根据版式解析出图片中固定区域的内容。
  • 字段定位

字段定位是针对收件人或寄件人的具体字段的区域检测,如电话号码、地址信息等。通过大量样本的训练,不断学习和适应各种运单中的版面变化、字体多样性变化、容忍各种噪声干扰等,最终训练得到准确性和稳定性非常强的字段定位的算法。字段定位效果示例如下图所示:

  • 电话号码识别运单上的电话号码通常是指11位的手机号或者8位的固定电话,基本上都是以整行的方式出现。通过长期的积累和对该场景的深入分析研究,万象优图提供了一套业内先进的整行识别技术,无需切分单字,直接识别整行手写字符。
  • 地址信息识别

针对地址场景,结合运单的具体需求,我们提供独创的地址信息识别方案。借鉴数字整行识别的方法,并针对省市区地址特征和手写文本特征,改进了识别网络,使其能够适应整行手写汉字的图像特点,并直接给出对应的省市区分类结果。整个地址识别流程简化成可以直接。

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技评论

学界 | 李飞飞最新论文:结合深度学习和谷歌街景来估算美国人口结构

AI科技评论按:最近,一篇名为《Using Deep Learning and Google Street View to Estimate the Demog...

29611
来自专栏量子位

建模数据科学家的福音:MIT系特征自动构造工具今日发布

Root 编译整理自TechCrunch & Feature Labs 量子位 报道 | 公众号 QbitAI 建模数据科学家的活难度很大。 得洞察big da...

4165
来自专栏CDA数据分析师

如果用Excel仪表盘分析雾霾……

注: 文中使用数据均来自互联网,为各城市2013年12月到2016年9月统计的大气质量相关指标月平均值。数据内只包含有代表性的一些城市,没有覆盖全国,数据没有经...

2295
来自专栏AI科技评论

大会 | CVPR 2018,AI科技评论将亲临美国盐湖城现场!

CVPR 2018 即将开幕,届时AI 科技评论将带来专题报道,欢迎大家持续关注。

1185
来自专栏小小挖掘机

NWP“企业招聘程序的经济决定因素和经济后果”

本文是针对发表在《Nber Working Papers》上的一篇论文 “Hiring Procedures in the Firm: Their Econom...

3184
来自专栏人工智能头条

探索物流预测珠峰:苏宁智能运输路线技术设计

1863
来自专栏数据猿

【案例】大拇哥财富——互联网金融个人评分模型

数据猿导读 随着互联网技术的不断发展,传统金融业务也从线下不断转移到线上,很多原先在线下的金融机构开始在互联网上开展经营活动。由于线上和线下的经营方式的差异,在...

3626
来自专栏新智元

CVPR 2018:剑桥大学等研发“暴力行为”检测系统,用无人机精准识别人群暴力

2325
来自专栏腾讯防水墙

为什么无牙象越来越多?防水墙助力大象公益,拒绝象牙买卖

932
来自专栏IT派

“死亡算法”:预测死亡时间准确率达90%!

导读:在2017年11月的IEEE国际生物信息学与生物医学大会上,斯坦福大学计算机科学系的一名研究生Anand Avati对“死亡算法”的研究进行了报告:预测死...

3425

扫码关注云+社区