专栏首页IT技术精选文摘快消品图像识别丨无人店背后的商品识别技术

快消品图像识别丨无人店背后的商品识别技术

人工智能一浪接一浪地席卷全球,AI的其中一个重要分支——计算机视觉,也如雨后春笋,不断涌现出新的想法和应用。人脸识别已经逐渐渗透我们的日常生活,机器能够认准人脸,想必大家都有所耳闻;而另一类计算机视觉的应用,是进行商品识别

当前新兴的一些无人零售店,背后就需要机器对商品进行自动识别,拍图购物、AR互动营销等场景,也运用了商品识别技术。人工智能商业公司ImageDT,则利用商品图像识别技术提供2B商业服务,包括基于互联网图片大数据的商业分析,以及基于门店货架识别渠道数据洞察,帮助消费品企业提升业绩。今天,图酱就跟大家科普应用在无人店、新零售中的商品识别技术。

数据逻辑

1 让小孩“记住”超市里的所有商品

我们教一个小孩识物的时候,比如“苹果”,首先要让他反复的看到 “苹果”,他便能认识“苹果”;他可能会认错,把“梨”认成“苹果”,这个时候应该帮他指出来。小孩看到的“苹果”越多,辨识的能力就越强。

基于深度神经网络的人工智能,让机器具备理解的能力,基本过程就像教一个小孩认苹果一样。首先要有大量的数据, 比如“苹果”的图片;同时,要增加大量机器会认错的“负样本”,比如“梨”的图片;然后经过一个深度神经网络,反复学习,最终获得一个有效的识别模型。对于快消商品的识别,我们不仅要认出一个瓶子包装,还要认出是一瓶酸奶还是啤酒;不仅要认出酸奶,还要认出是哪个品牌的酸奶,甚至是哪个口味和规格。要让机器能够准确识别成千上万的快消商品SKU,是一项极其庞大而复杂的AI工程。

数据采集

2 让机器获得学习的原始素材

首先,我们需要梳理出所有的目标商品清单,并设法获得每一件商品的图片数据。根据商品的特征辨识度,通常需要几十到几百张的有效图片。数据采集是一套组合拳。电商平台上拥有结构化的商品介绍图片以及大量的买家晒图,社交平台上也能获取到大量的消费者晒图,是性价比最高的数据源。超市店内的真实货架数据,是最可靠的数据源,但获取和后期处理的成本都比较高。除此之外,ImageDT还通过自主研发智能灯箱智能采集车,模拟各种不同的场景对商品进行360°拍摄从而建立庞大的训练数据库,以此来获取最丰富的训练数据

数据标注

3 有多少人工,才有多少智能采集到原始图片数据,通常会混杂许多“脏数据”,需要进行清洗;大部分情况下,还需要对图片中的物体进行标注分类。只有可靠的数据才能产生高质量的识别模型。在每一个人工智能公司,都有一支特殊的军队——数据标注团队。ImageDT也不例外,在背后支撑这个团队的是一个充满黑科技的标注系统。

比如,图片在标注前通常会先经过弱模型的处理,让机器先解决 50%的问题;系统有支持批量标注的小图模式,让标注员可以一目十行,成倍提高标注的速度;产品经理反复打磨每一个功能,做A/B测试,从每处细节提高标注的体验和效率。除此之外,标注团队还为不同任务配置了不同等级的质量保证机制,包括抽样审核、全量审核、交叉校验、埋点校验等,确保让机器学习最准确最可靠的训练数据。

模型训练

4 “活到老学到老”,机器也要不断学习

准备好了数据,下一步就是让机器进行学习,建立识别模型的过程。同样的数据,选择不同的神经网络算法、以及不同的参数设置,将会影响最终模型的效果。模型建立之后,还需要进行管理:模型之间存在层次关系,数据和模型会存在版本的迭代,这些问题,当遇到大量商品类别的时候,显得非常艰难。在ImageDT内部,有一个自助式的深度学习平台,支持拖拉拽的算法和参数测试,甚至一个非程序员都可以傻瓜式的完成一次建模任务,并获得模型的效果评估报告。每一位ImageDT的新员工,不管是工程师,还是前台,都会接受一次半小时的建模培训;而在培训结束后,每个人都将能够独立的建立一个图像识别模型,整个过程只需要半小时

同时,深度学习平台就像一个模型仓库,兼顾着对象、数据和模型的管理。整个建模的过程已经标准化,最快只需要一天,就能完成从数据采集、标注、建模到上线的整个流程ImageDT的研发团队分为四个组,产品组、建模组、数据组和研究组。前三个组,负责实现流水线的搭建和经营,使得每天都能井井有条地建立大量新的商品识别模型,并快速上线,对每天数千万的图片数据进行识别和分析。研究组,则要克服各种疑难杂症,比如容易产生褶皱的软包装、商品侧面和背面的识别、遮挡和反光环境下的识别等等。

目前,在实际生产环境下,已经达到95%以上的识别准确率。人脸都有眼睛、鼻子、嘴巴等固定的特征,而超市中琳琅满目的商品,则千奇百态。与人脸识别相比,商品识别有更高的工程复杂度。ImageDT正在做的,就是实现这个庞大的AI工程,让机器能够自动地、准确地识别每一件商品。零售智能货架演示

本文分享自微信公众号 - IT技术精选文摘(ITHK01),作者:ImageDT图匠数据

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-11-07

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 微信后台基于时间序的海量数据冷热分级架构设计实践

    用户1263954
  • 一场版本升级引发的性能血案的追凶过程

    用户1263954
  • 带着问题学习分布式系统之数据分片

    分布式系统(尤其是分布式存储系统)需要解决的两个最主要的问题,即数据分片和数据冗余,下面这个图片形象生动的解释了其概念和区别: ? 其中数据即A、B属于数据分片...

    用户1263954
  • 机器学习领域的突破性进展(附视频中字)

    机器学习的发展涉及到各个方面,从语音识别到智能回复。但这些系统中的“智能”实际上是如何工作的呢?还存在什么主要挑战?在本次讲座中将一一解答。 Google I/...

    CDA数据分析师
  • 专访 | 蚂蚁金服生物识别技术负责人陈继东:数据驱动人工智能引发行业变革

    机器之心原创 作者:高静宜 「身份验证是整个互联网金融的基础,要做到从实名到实人,生物识别在这里起到了很重要的作用。」蚂蚁金服生物识别技术负责人、全球核身平台...

    机器之心
  • 漫话:如何给女朋友解释什么是反向代理?

    周末,我正在网上搜索简历,准备给团队招聘新人。这时候,女朋友回来了,看起来并不是很高兴。

    Java3y
  • 终于有人把正向代理和反向代理解释的明明白白了!

    周末,我正在网上搜索简历,准备给团队招聘新人。这时候,女朋友回来了,看起来并不是很高兴。

    Java团长
  • 快讯 | 全国首个“刷脸安检门”来了!

    澎湃新闻消息,广州地铁安检将率先试水“人脸识别”技术,目前在珠江新城站、万胜围站、嘉禾望岗站设置了人工智能安检门,但暂时未向乘客启用。

    大数据文摘
  • 剖析广州“开四停四”交通限行的实现技术

    今天我们就从技术的角度,来剖析一下如何技术上实现“开四停四”的判定执法。

    Frank
  • 大数据AND机器学习:大数据是原材料,机器学习是原材料加工厂

    导 读 大数据是原材料,机器学习是原材料加工厂,而新一代人工智能服务则是工厂出炉的产品被消费在越来越多的日常生活中。 在Deepmind和AlphaGo获得的...

    CDA数据分析师

扫码关注云+社区

领取腾讯云代金券