前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >智慧零售产业应用实战,30分钟上手的高精度商品识别

智慧零售产业应用实战,30分钟上手的高精度商品识别

作者头像
用户1386409
发布于 2022-04-19 09:27:18
发布于 2022-04-19 09:27:18
7920
举报
文章被收录于专栏:PaddlePaddlePaddlePaddle
近几年,随着“新零售”概念的火热,越来越多的品牌商及商超零售企业开始引进人工智能技术,探索商品管理、成本控制、用户体验等多维度的数字化转型,转型中所涉及的货架陈列分析、智能结算、智能库存管理、智能货柜、电商平台等以图搜图的场景背后的核心技术都离不开商品识别算法。

图1 商品识别应用展示

然而,相较更加普遍的人脸识别技术来说,商品识别在实际的产业应用中也面临着其独有的巨大挑战:

  • 商品包装相似:同类别商品口味不同且价格也不同,不同类别商品外包装相似,都对图像识别精度具有较高的要求;
  • 干扰因素众多:同类别商品在识别时容易因角度问题发生变形、折叠、遮挡等干扰,对识别结果造成影响;
  • 品类更新极快:零售商品通常以小时级别速度更新迭代,每增加新产品时若仅靠单一模型均需重新训练模型,模型训练成本及时间成本极大;

针对上述难点,飞桨产业实践范例库基于真实零售场景中的数据,推出了智慧商超商品识别范例,可用于商品智能结算等多种场景,提供从数据准备、技术方案、模型训练优化,到模型部署的全流程可复用方案,有效解决了识别速度和精度要求极高、不同商品相似度极高、模型重训成本高的问题,大大提高了人工智能在商超零售行业的应用落地可能性。

⭐项目链接⭐

https://github.com/PaddlePaddle/PaddleClas/tree/develop/docs/zh_CN/samples

所有源码及教程均已开源,欢迎大家star鼓励~

智慧零售商品识别方案

基于PP-ShiTu实现的商品识别方案为零售场景中商品多类别、小样本、高相似和更新频繁问题提供了新的思路,不仅能对多类别商品进行精准识别,也可以满足对预测效率的极致追求。

图2 商品识别目标说明

场景难点

  • 数据相似度高:同一件商品,在不同情况下所获得的商品图像往往存在相当大的差异;不同商品很可能拥有非常类似的包装,比如口味不同。
  • 系统性能要求高:需要同时解决检测和识别两个任务,选模型和优化时要权衡精度与速度两方面。
  • 模型泛化性要求高:需要支持对未知类别的商品进行识别,有效支持训练数据少、新增类别的情况。

方案设计

针对上述难点,经过对模型性能精度和速度的考虑,最终选用了飞桨图像分类套件PaddleClas开源的图像识别PP-ShiTu技术方案,并且使用飞桨服务化部署框架Paddle Serving 进行服务化部署。

PP-ShiTu是一个实用的轻量级通用图像识别系统,主要由主体检测、特征学习和向量检索三个模块组成。该系统从骨干网络选择和调整、损失函数的选择、数据增强、学习率变换策略、正则化参数选择、预训练模型使用以及模型裁剪量化8个方面,采用多种策略,对各个模块的模型进行优化,并经过10w+类别数据进行训练,最终得到在CPU上预测时间仅需0.2s的多场景通用图像识别系统

图3 项目方案说明

模型优化策略和效果

尝试数据增强、换不同的backbone、选择不同的Metric Learning方法、采用蒸馏方法进行模型调优,针对不同方案给出实验效果,模型最终可以达到98.39%以上的Top1 Recall

同时,为满足商品识别场景需要兼具扩展性的要求,本范例还提供了低成本更新检索库的识别方案,无需重新训练模型即可实现对新增类别的精准识别,具体解决方案欢迎大家关注直播课。

图4 效果展示说明

部署方案

部署方面使用飞桨服务化部署框架Paddle Serving进行部署,满足用户批量预测、数据安全性高、延迟低的需求,快速在本地完成部署方案,本次范例包含模型转换配置到部署请求的全流程讲解,欢迎小伙伴们关注直播。

如下图展示本次商品识别范例在智能结算场景的应用

范例使用工具介绍

PaddleClas是一个提供了从数据处理、模型准备、模型优化、到预测部署全流程工具的图像分类开发套件。其中的轻量级图像识别系统PP-ShiTu更是综合了目标检测、图像分类、度量学习、图像检索等多重技术,能够完美解决小样本、高相似、多类别等产业落地难点,CPU上仅需0.2s轻松识别十万类,而且十分简单易用,极大地降低开发门槛。

产业实践范例教程

助力企业跨越AI落地鸿沟

飞桨产业实践范例,致力于加速AI在产业落地的前进路径,减少理论技术与产业应用的差距。范例来源于产业真实业务场景,通过完整的代码实现,提供从数据准备到模型部署的方案过程解析,堪称产业落地的“自动导航”。

  • 真实产业场景:与实际具有AI应用的企业合作共建,选取企业高频需求的AI应用场景如智慧城市-安全帽检测、智能制造-表计读数等;
  • 完整代码实现:提供可一键运行的代码,在“AI Studio一站式开发平台”上使用免费算力一键Notebook运行;
  • 详细过程解析:深度解析从数据准备和处理、模型选择、模型优化和部署的AI落地全流程,共享可复用的模型调参和优化经验;
  • 直达项目落地:百度高工手把手教用户进行全流程代码实践,轻松直达项目POC阶段。
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-04-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 PaddlePaddle 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
我们做了一个智能零售结算平台
目前在零售行业的实际运营过程中,会产生巨大的人力成本,例如导购、保洁、结算等,而其中,尤其需要花费大量的人力成本和时间成本在识别商品并对其进行价格结算的过程中,并且在此过程中,顾客也因此而需要排队等待。这样一来零售行业人力成本较大、工作效率极低,二来也使得顾客的购物体验下降。
Datawhale
2022/10/31
9530
我们做了一个智能零售结算平台
10分钟搭建商品结算平台!商品、车辆识别一网打尽
"商品识别"、"人脸识别"、"以图搜图"有什么难?这个在 GitHub 上狂圈 Star 3100+ 的项目就能轻松帮你实现!
HelloGitHub
2021/12/21
1.2K0
10分钟搭建商品结算平台!商品、车辆识别一网打尽
18M 超轻量图像识别系统,商品、车辆、人脸识别一网打尽!
图像识别作为深度学习算法的主流实践应用方向,早已在生活的各个领域发挥作用,如安全检查和身份核验时的人脸识别、无人货架和智能零售柜中的商品识别,这些任务背后的关键技术都在于此。
用户1386409
2022/03/31
9050
18M 超轻量图像识别系统,商品、车辆、人脸识别一网打尽!
GitHub 斩获 3100+ Star,国人开源的这个图像识别系统好用到爆!!!
如果你们想要实现酷炫的"商品识别"、"以图搜图",进军新消费领域却没有相应技术方案,怎么办?
GitHubDaily
2021/12/17
5.3K0
GitHub 斩获 3100+ Star,国人开源的这个图像识别系统好用到爆!!!
人员出入管理效率如何提升?超轻量图像分类方案详解
近几年,人工智能计算机视觉技术在安防、工业制造等场景的产业智能化升级进程中发挥着举足轻重的作用。“人员进出管理”作为各行业中的关键场景,应用需求十分迫切。如居家防盗、机房管理以及景区危险告警等场景,需要对异常目标(人、车或其他物体)不经允许擅自进入规定区域进行及时检测。利用深度学习视觉技术,可以及时准确地对闯入行为进行识别并发出告警信息,切实保障人员的生命财产安全。相比传统人力监管的方式,不仅可以实现7X24小时不间断的全方位保护,还能极大地降低管理成本,解放劳动力。
用户1386409
2022/08/31
3300
手把手教学电瓶车进电梯检测、多类别车辆追踪、异常行为检测产业级应用
近日,媒体接连报道电动车起火爆炸造成严重人员伤亡的新闻,针对该问题,社区物业明令禁止电瓶车入户,但是依然有人忽视这个问题严重性。目前,AI应用已经可以有效地预防此类问题,在进入电梯的时候就可以采取报警和有效措施。AI在安防领域的应用非常广泛,在各类公共场合迅速识别人员摔倒、打架、争吵,以及车辆行驶异常等行为,可以及时通知安保人员进行干预。
用户1386409
2022/03/31
4560
手把手教学电瓶车进电梯检测、多类别车辆追踪、异常行为检测产业级应用
智慧城市产业应用实践,高精度火灾烟雾检测方案详解
据报道,2021年全国消防救援队伍共接报火灾74.8万起,死亡1987人,受伤2225人,直接财产损失67.5亿元。传统靠人工报警的方法存在人员管理难、场地数量多且分散等问题,无法有效发现险情降低火灾损失。为了保障民众的生命财产安全,应用AI技术及时、自动检测监控区域内的烟雾和火灾至关重要。
用户1386409
2022/04/19
3580
智慧城市产业应用实践,高精度火灾烟雾检测方案详解
工业安全如何保障?30分钟上手安全帽检测全流程方案
在工厂、建筑工地、矿井等施工现场,安全帽是保障在场人员安全的重要防护装备。但当人员未佩戴安全帽进入施工场所时,靠人为监管耗时耗力,不易实时监管。针对上述问题,探索智能化转型的企业开始通过视频监控->目标检测->智能督导的方式智能、高效地完成此任务。
用户1386409
2022/08/31
4160
30倍加速,3毫秒急速识别,人、车、OCR等9大分类任务一网打尽
“图像分类”作为人工智能领域的重要基础任务,早已在安防监控、智慧交通、医疗影像诊断甚至社交娱乐等行业被广泛应用,成为AI从业者的“必备技能”,例如安防系统中的人体属性识别;文档电子化、卡证识别中的图片方向校准;辅助驾驶中的交通标识、红绿灯状态识别等等,都离不开图像分类技术的支持。 图1 PaddleClas图像分类应用示意图 然而,在实际产业应用中,想要得到一个既快又好的分类模型依然面临很多挑战: 大模型精度-速度难以兼顾 从大名鼎鼎的Resnet50到如今火热的Swin-Transformer,模型精
机器学习AI算法工程
2022/06/13
7500
30倍加速,3毫秒急速识别,人、车、OCR等9大分类任务一网打尽
华为零售商品识别一等奖方案
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程   公众号:datayx 商品识别在零售行业的应用 一、图像识别的应用场景,以及对零售行业的变革 1.以图搜图,拍照购物 说到图像识别,大家可能马上能想到以图搜图的方式,也就是“拍照购”。这个想法出现的很早,在零几年的时候就有很多公司开始做这方面的尝试。 美国硅谷的snaptell,他们早在零六年的时候就开始做拍照购物的应用场景,他们做的大部分是一些书籍和CD类的简单物品识别,2009年被Amazon收购。2015年Amazon收购了另一
机器学习AI算法工程
2022/03/14
8000
智慧零售商品识别系统方案解析,15分钟上手商品识别AI模型
消费型经济模式下,品牌与消费的格局在经历巨大的变化,数智化转型是品牌提升竞争力,驱动未来价值增长的引擎。 数智化战略的成功,远远不止是线上渠道开发、数据系统搭建和用户数据研究, 而需要把“数智化”融入到品牌从生产到经营的每个环节中。 本期公开课将重点从线下门店的数字化巡店方案切入,一探究竟。
用户1386409
2022/08/31
1.5K0
一行代码完成模型训练,30倍加速,3毫秒急速识别,超强图像分类算法开源!
人脸、车辆、人体属性、卡证、交通标识等经典图像识别能力,在我们当前数字化工作及生活中发挥着极其重要的作用。业内也不乏顶尖公司提供的可直接调用的API、SDK,但这些往往面临着定制化场景泛化效果不好、价格昂贵、黑盒可控性低、技术壁垒难以形成多诸多痛点。 而今天小编要给大家推荐的是一个完全开源免费的、覆盖人、车、OCR等9大经典识别场景、在CPU上可3毫秒实现急速识别、一行代码就可实现迭代训练的项目! 图1 PaddleClas图像分类应用示意图 话不多说,赶紧送上传送门,识货的小伙伴赶紧尝试一下吧! htt
OpenCV学堂
2022/06/16
4940
一行代码完成模型训练,30倍加速,3毫秒急速识别,超强图像分类算法开源!
高精度轻量级目标检测产业应用,实现多类通信塔识别
随着科技的发展,各种即时通讯早已是人类日常生活不可分割的一部分,而这一便捷服务的实现离不开各种通信塔。通信塔主要用于运营商、广播电视等部门架设信号发射天线或微波传输设备,对通信塔及时正确地维护是保障无线通信系统正常运行的必要手段。
用户1386409
2022/03/31
3330
高精度轻量级目标检测产业应用,实现多类通信塔识别
AI+社区智能管理,赋能智慧城市人情共「智」
随着城市化的快速推进及人口流动的快速增加,传统社区治理在人员出入管控、安防巡逻、车辆停放管理等典型场景下都面临着人力不足、效率低下、响应不及时等诸多难题。而人工智能技术代替人力,实现人、车、事的精准治理,大幅降低人力、物质、时间等成本,以最低成本发挥最强大的管理效能,有效推动城市治理向更“数字化、自动化、智慧化”的方向演进。
用户1386409
2022/04/19
7860
AI+社区智能管理,赋能智慧城市人情共「智」
​金融产业应用详解 | 表单自动识别、保险智能问答端到端方案
随着人工智能技术的逐渐成熟,计算机视觉、语音、自然语言处理等技术在金融行业的应用从广度和深度上都在加速,这不仅降低了金融机构的运营和风险成本,而且有助于提升客户的满意度,比如:利用OCR技术快速处理海量表格做信息结构化抽取和存储,大幅提升从业人员工作效率;利用NLP技术实现智能问答解决方案,帮助用户即使没有复杂的金融背景知识也能快速找到自己需要的信息。
用户1386409
2022/09/01
8450
​金融产业应用详解 | 表单自动识别、保险智能问答端到端方案
OCR产业应用实战,多类别电表读数识别方案详解
我国电力行业发展迅速,电表作为测电设备经历了普通电表、预付费电表和智能电表三个阶段的发展。在产业场景中,表的种类多达十几种,过去依赖人工抄表,成本很高。如果能够采集到大量电表图片,借助人工智能技术批量检测和识别,将会大幅提升效率。
用户1386409
2022/03/31
8470
OCR产业应用实战,多类别电表读数识别方案详解
一站式完成车牌识别任务:从模型优化到端侧部署
交通领域的应用智能化不断往纵深发展,其中最为成熟的车牌识别早已融入人们的日常生活之中,在高速公路电子收费系统、停车场等场景中随处可见。一些企业在具体业务中倾向采用开源方案降低研发成本,但现有公开的方案中少有完成端到端的车牌应用范例。
用户1386409
2022/08/31
8650
学界 | 旷视科技发布最大商品识别数据集,推动新零售自动收银场景落地
近期,旷视科技南京研究院发布学术界内目前最大的商品识别数据集——RPC,其图像数量和类别数量皆是该领域之最。同时,该数据集针对新零售场景定义了一个新问题,即视觉自动收银(automatic check-out, ACO),模拟零售真实结算场景。此外,还针对 ACO 任务给出了一套完整的 Baseline Method,以及“整单准确率”cAcc为代表的一系列评测指标,更有可以直接安装的 Python 版本评测工具。同名 GitHub 项目主页上有 Leaderboard,欢迎大家来刷榜!
AI科技评论
2019/11/01
1.4K0
学界 | 旷视科技发布最大商品识别数据集,推动新零售自动收银场景落地
如何在有限算力下实现智能驾驶多任务高精度识别?
近几年,随着自动驾驶、车路协同等概念的日益火热,地图厂商、传统汽车厂商以及有互联网背景的“造车新势力”纷纷加入了智能升级的探索之路。为了使智能驾驶更安全更可靠,实现高精度、实时感知周围环境的技术至关重要,该技术不仅可以精准快速地识别车道线、行驶区域、行人、车辆等,而且将车辆行驶路线“画”在地面,为驾驶人员提供车距监测、行人预警、车道偏离提醒和红绿灯提醒等一系列安全辅助功能,助力驾驶系统进行高效的决策。
用户1386409
2022/03/31
4470
如何在有限算力下实现智能驾驶多任务高精度识别?
零门槛上手商品销量预测模型,一键实现销量走势预估及智能决策
中国零售业正处在互联网人口红利消失、传统线下零售渠道占比萎缩的发展疲软期,亟需一剂“助推剂”。[1]AI技术与零售业的融合或是发展良方之一。AI技术对零售业的革新价值不仅体现在重构消费者关系、刺激消费需求等方面;同时,也加速促进了零售业“人- 货-场”的环状结构优化,改变了对零售商品及消费者数据的采集、分析和价值应用形式。
用户1386409
2022/09/01
1K0
零门槛上手商品销量预测模型,一键实现销量走势预估及智能决策
推荐阅读
我们做了一个智能零售结算平台
9530
10分钟搭建商品结算平台!商品、车辆识别一网打尽
1.2K0
18M 超轻量图像识别系统,商品、车辆、人脸识别一网打尽!
9050
GitHub 斩获 3100+ Star,国人开源的这个图像识别系统好用到爆!!!
5.3K0
人员出入管理效率如何提升?超轻量图像分类方案详解
3300
手把手教学电瓶车进电梯检测、多类别车辆追踪、异常行为检测产业级应用
4560
智慧城市产业应用实践,高精度火灾烟雾检测方案详解
3580
工业安全如何保障?30分钟上手安全帽检测全流程方案
4160
30倍加速,3毫秒急速识别,人、车、OCR等9大分类任务一网打尽
7500
华为零售商品识别一等奖方案
8000
智慧零售商品识别系统方案解析,15分钟上手商品识别AI模型
1.5K0
一行代码完成模型训练,30倍加速,3毫秒急速识别,超强图像分类算法开源!
4940
高精度轻量级目标检测产业应用,实现多类通信塔识别
3330
AI+社区智能管理,赋能智慧城市人情共「智」
7860
​金融产业应用详解 | 表单自动识别、保险智能问答端到端方案
8450
OCR产业应用实战,多类别电表读数识别方案详解
8470
一站式完成车牌识别任务:从模型优化到端侧部署
8650
学界 | 旷视科技发布最大商品识别数据集,推动新零售自动收银场景落地
1.4K0
如何在有限算力下实现智能驾驶多任务高精度识别?
4470
零门槛上手商品销量预测模型,一键实现销量走势预估及智能决策
1K0
相关推荐
我们做了一个智能零售结算平台
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文