前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >10分钟搭建商品结算平台!商品、车辆识别一网打尽

10分钟搭建商品结算平台!商品、车辆识别一网打尽

作者头像
HelloGitHub
发布于 2021-12-21 07:55:36
发布于 2021-12-21 07:55:36
1.2K0
举报
文章被收录于专栏:HelloGitHubHelloGitHub

"商品识别"、"人脸识别"、"以图搜图"有什么难?这个在 GitHub 上狂圈 Star 3100+ 的项目就能轻松帮你实现!

它就是全开源、轻量级的图像识别系统 PP-ShiTu。它不仅带有十万类物品的特征信息,可以实时准确地识别出目标的品类规格商标颜色等属性信息,而且单张图片用 CPU 处理仅需 0.2s!在出现新品类的时候,不需要重新训练系统,补充检索库即可快速扩充识别范围,高效易用,全民友好!

话不多说!直接传送门:

https://github.com/PaddlePaddle/PaddleClas

记得Star收藏支持开源项目,也防止走丢哦!

不过说来容易,现实中的图像识别任务真有这么简单么?当然不是,一个优秀的图像识别系统往往在处理实际场景问题过程中需要面临各种挑战:

1.商品类别数以万计:根本没法事先把所有类别都放入训练集;

2.不同商品相似度极高:比如同一种饮料的不同口味,就很可能拥有非常类似的包装。而且即便对于同一件商品,在不同情况下所获得的商品图像都往往存在相当大的差异

3.品类更新极快:像新零售这种行业,新品几乎都是按小时级别在更新,每增加新的产品都要辛辛苦苦重新训练模型,仅靠单一模型想要跟上步伐,着实望尘莫及。

当然这些产业难点也从另一个角度说明了PP-ShiTu图像识别系统的能力,它不仅有高水平的特征学习能力,对新出现的产品也可以在不用重新训练算法的情况下,直接通过配置检索库的方式实现识别。

这样的特殊能力,得益于 PP-ShiTu 对度量学习、图像检索等能力的引入,构建成了统一、通用的图像识别系统:

这个通用图像识别系统中有 3 个核心模块

  • 主体检测:不同于一般的目标检测,主体检测是将目标物体和背景区分开来,能够有效减少干扰特征。PP-ShiTu 中所采用的是目标检测模型 PP-PicoDet,不仅预测速度超快,精度上也达到了 SOTA,为后续的准确识别打下坚实基础;
  • 特征提取:作为图像识别系统的重点工作,PP-ShiTu 是采用CPU级轻量化骨干网络 PP-LCNet,并结合度量学习 arcmargin 算法,对高相似物体的区分效果远超单一模型,不仅准确率超越大模型 ResNet50,预测速度还能快3倍!再加上经过 18w 类数据集打磨的预训练权重,不用再费心选择,一个模型就可以实现多场景覆盖!
  • 向量检索:不同于单一模型直接输出类别信息,对于未知类别只有模型重训一个选择,耗时又耗力。PP-ShiTu 引入向量检索,通过计算目标物体和检索库中图像的相似度来输出类别信息,一次训练长期使用,高效又便捷。

目前整套系统已经在 GitHub 上开源发布,并且引起开发者的广泛关注与应用。

华东理工大学的高材生颜鑫,也是飞桨领航团的团长,带领团队基于 PP-ShiTu 开发的这套智能购物平台系统:通过图像即可精准识别顾客购买的商品,并返回完整的购物清单及应付价格,为智能货柜提供了非常好的视觉化解决方案,同时对于商品识别中品类众多、外观相似和更新频繁的痛难点也提供了可参考的示范。

链接指路:

https://github.com/thomas-yanxin/Smart_container

(欢迎⭐Star⭐收藏,不易走丢哦)

不仅如此,当系统有新商品增加时,仅需打开手机小程序,拍照更新检索库即可,无需重新训练模型,甚至一张图片就可以实现对新类别的识别,还能随时随地对检索库中的类别进行管理。再也不用担心促销季、购物节跟不上脚步了!

其实商品识别的能力远不仅如此,商超能够通过这项技术进行资产保护,降低运营成本;时尚行业能够通过这项技术,完成对秀场服装的大数据分析,把握时尚潮流;服装行业可以通过商品识别快速匹配产品材质和生产工艺等相关信息,大幅提升生产效率。

知“人”善用,是提高战斗力的一大法宝;同样,将最先进的 AI 商品识别技术应用落地各行各业,也能够带来很多赋能革新,充分帮助 B 端客户提高效率、降低成本的同时,也能优化 C 端客户的直接体验。未来,从设计到生产、从物流到销售,AI 商品识别,大有可为!

如果您想详细了解更多飞桨的相关内容,请参阅以下文档。

官网地址:

https://www.paddlepaddle.org.cn

【PaddleClas】项目地址:

GitHub:

https://github.com/PaddlePaddle/PaddleClas/tree/release/2.3

Gitee:

https://gitee.com/paddlepaddle/PaddleClas

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-12-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 HelloGitHub 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
18M 超轻量图像识别系统,商品、车辆、人脸识别一网打尽!
图像识别作为深度学习算法的主流实践应用方向,早已在生活的各个领域发挥作用,如安全检查和身份核验时的人脸识别、无人货架和智能零售柜中的商品识别,这些任务背后的关键技术都在于此。
用户1386409
2022/03/31
9180
18M 超轻量图像识别系统,商品、车辆、人脸识别一网打尽!
GitHub 斩获 3100+ Star,国人开源的这个图像识别系统好用到爆!!!
如果你们想要实现酷炫的"商品识别"、"以图搜图",进军新消费领域却没有相应技术方案,怎么办?
GitHubDaily
2021/12/17
5.4K0
GitHub 斩获 3100+ Star,国人开源的这个图像识别系统好用到爆!!!
我们做了一个智能零售结算平台
目前在零售行业的实际运营过程中,会产生巨大的人力成本,例如导购、保洁、结算等,而其中,尤其需要花费大量的人力成本和时间成本在识别商品并对其进行价格结算的过程中,并且在此过程中,顾客也因此而需要排队等待。这样一来零售行业人力成本较大、工作效率极低,二来也使得顾客的购物体验下降。
Datawhale
2022/10/31
9680
我们做了一个智能零售结算平台
智慧零售产业应用实战,30分钟上手的高精度商品识别
然而,相较更加普遍的人脸识别技术来说,商品识别在实际的产业应用中也面临着其独有的巨大挑战:
用户1386409
2022/04/19
8010
智慧零售产业应用实战,30分钟上手的高精度商品识别
人员出入管理效率如何提升?超轻量图像分类方案详解
近几年,人工智能计算机视觉技术在安防、工业制造等场景的产业智能化升级进程中发挥着举足轻重的作用。“人员进出管理”作为各行业中的关键场景,应用需求十分迫切。如居家防盗、机房管理以及景区危险告警等场景,需要对异常目标(人、车或其他物体)不经允许擅自进入规定区域进行及时检测。利用深度学习视觉技术,可以及时准确地对闯入行为进行识别并发出告警信息,切实保障人员的生命财产安全。相比传统人力监管的方式,不仅可以实现7X24小时不间断的全方位保护,还能极大地降低管理成本,解放劳动力。
用户1386409
2022/08/31
3380
手把手教学电瓶车进电梯检测、多类别车辆追踪、异常行为检测产业级应用
近日,媒体接连报道电动车起火爆炸造成严重人员伤亡的新闻,针对该问题,社区物业明令禁止电瓶车入户,但是依然有人忽视这个问题严重性。目前,AI应用已经可以有效地预防此类问题,在进入电梯的时候就可以采取报警和有效措施。AI在安防领域的应用非常广泛,在各类公共场合迅速识别人员摔倒、打架、争吵,以及车辆行驶异常等行为,可以及时通知安保人员进行干预。
用户1386409
2022/03/31
4610
手把手教学电瓶车进电梯检测、多类别车辆追踪、异常行为检测产业级应用
30倍加速,3毫秒急速识别,人、车、OCR等9大分类任务一网打尽
“图像分类”作为人工智能领域的重要基础任务,早已在安防监控、智慧交通、医疗影像诊断甚至社交娱乐等行业被广泛应用,成为AI从业者的“必备技能”,例如安防系统中的人体属性识别;文档电子化、卡证识别中的图片方向校准;辅助驾驶中的交通标识、红绿灯状态识别等等,都离不开图像分类技术的支持。 图1 PaddleClas图像分类应用示意图 然而,在实际产业应用中,想要得到一个既快又好的分类模型依然面临很多挑战: 大模型精度-速度难以兼顾 从大名鼎鼎的Resnet50到如今火热的Swin-Transformer,模型精
机器学习AI算法工程
2022/06/13
7630
30倍加速,3毫秒急速识别,人、车、OCR等9大分类任务一网打尽
AI+社区智能管理,赋能智慧城市人情共「智」
随着城市化的快速推进及人口流动的快速增加,传统社区治理在人员出入管控、安防巡逻、车辆停放管理等典型场景下都面临着人力不足、效率低下、响应不及时等诸多难题。而人工智能技术代替人力,实现人、车、事的精准治理,大幅降低人力、物质、时间等成本,以最低成本发挥最强大的管理效能,有效推动城市治理向更“数字化、自动化、智慧化”的方向演进。
用户1386409
2022/04/19
8030
AI+社区智能管理,赋能智慧城市人情共「智」
全球首个「开源图像识别系统」上线了!
父老们,乡亲们!你知道人脸、商品、车辆识别,以图搜图乃至自动驾驶,背后的技术是什么嘛?
肉眼品世界
2021/07/13
9640
全球首个「开源图像识别系统」上线了!
一行代码完成模型训练,30倍加速,3毫秒急速识别,超强图像分类算法开源!
人脸、车辆、人体属性、卡证、交通标识等经典图像识别能力,在我们当前数字化工作及生活中发挥着极其重要的作用。业内也不乏顶尖公司提供的可直接调用的API、SDK,但这些往往面临着定制化场景泛化效果不好、价格昂贵、黑盒可控性低、技术壁垒难以形成多诸多痛点。 而今天小编要给大家推荐的是一个完全开源免费的、覆盖人、车、OCR等9大经典识别场景、在CPU上可3毫秒实现急速识别、一行代码就可实现迭代训练的项目! 图1 PaddleClas图像分类应用示意图 话不多说,赶紧送上传送门,识货的小伙伴赶紧尝试一下吧! htt
OpenCV学堂
2022/06/16
5000
一行代码完成模型训练,30倍加速,3毫秒急速识别,超强图像分类算法开源!
效果提升7%、速度增加220%,OCR开源神器PaddleOCR再迎升级
机器之心专栏 作者:百度飞桨 最近,机器之心报道过的 PaddleOCR 项目迎来更新,发布了最新的 PP-OCR,又一次在 OCR 方向引起了大家的关注。 论文地址:https://arxiv.org/abs/2109.03144 项目地址:https://github.com/PaddlePaddle/PaddleOCR 从效果上看,PP-OCRv2 主要有三个方面提升: 在模型效果上,相对于 PP-OCR mobile 版本提升超 7%; 在速度上,相对于 PP-OCR server 版本提升超过
机器之心
2023/03/29
3.4K0
效果提升7%、速度增加220%,OCR开源神器PaddleOCR再迎升级
毫秒级预测,性能卓越!检测、跟踪、行为识别都搞定!这套行人分析系统重磅开源!
行人检测跟踪计数、人员行为分析、人员属性分析、人员操作及穿戴合规监测等场景化能力在工业、安防、金融、能源等行业有着极其广泛的应用需求。以深度学习视觉技术为核心的行人分析能力,则是以上任务的核心关键,也是近十年人工智能科技公司不断发力深耕的赛道。
CV君
2022/04/18
1.2K0
毫秒级预测,性能卓越!检测、跟踪、行为识别都搞定!这套行人分析系统重磅开源!
物体识别技术长篇研究
物体识别是计算机视觉领域中的一项基础研究,它的任务是识别出图像中有什么物体,并报告出这个物体在图像表示的场景中的位置和方向。目前物体识别方法可以归为两类:基于模型的或者基于上下文识别的方法,二维物体识别或者三维物体识别方法。对于物体识别方法的评价标准,Grimson 总结出了大多数研究者主要认可的 4 个标准:健壮性(robustness)、正确性(correctness)、效率(efficiency)和范围(scope)。
放飞人夜
2020/02/06
2K0
Google AI地标检索识别竞赛双料获胜方案 | 飞桨PaddlePaddle开源
Google 今年更新了目前最大的人造和自然地标识别数据集,发布了 Google-Landmarks-v2,数据集中包含超过 400 万张图片,描述了 20 万处类别地标。训练数据没有经过精细人工标注,类别数目严重不均衡,同一个地标的图像受到拍摄角度、遮挡、天气以及光线等影响很大,同时含有大量非地标数据,符合实际情况,非常具有挑战性。基于此数据集,今年总共吸引全球超过 300 支队伍参与了 Google 主办的地标检索识别竞赛。
机器之心
2019/07/03
1.1K0
Google AI地标检索识别竞赛双料获胜方案 | 飞桨PaddlePaddle开源
超越YOLO v5的最强算法矩阵来啦!PP-YOLOE、PP-PicoDet 云边端一网打尽!
目标检测作为计算机视觉领域的顶梁柱,不仅可以独立完成车辆、商品、缺陷检测等任务,也是人脸识别、视频分析、以图搜图等复合技术的核心模块,在自动驾驶、工业视觉、安防交通等领域的商业价值有目共睹。
AI算法与图像处理
2022/05/19
1.2K0
超越YOLO v5的最强算法矩阵来啦!PP-YOLOE、PP-PicoDet 云边端一网打尽!
精度45.9%,推理速度72.9FPS,百度飞桨推出工业级目标检测模型 PP-YOLO
工业视觉、自动驾驶、安防、新零售等我们身边熟知的各行各业都需要目标检测技术,由于其很好的平衡了标注成本、检测精度和速度等,成为当前智能制造产业升级浪潮中被商业化应用最为广泛的AI技术之一。
用户1386409
2020/08/17
8480
精度45.9%,推理速度72.9FPS,百度飞桨推出工业级目标检测模型 PP-YOLO
23个系列分类网络,10万分类预训练模型,这是飞桨PaddleClas百宝箱
今天咱们来聊聊计算机视觉领域最核心的技术之一——图像分类。顾名思义图像分类是指根据图像信息把不同类别的图像自动区分开来,并能指出图像类别信息。如图 1 所示,当前图像分类技术有着非常广泛的应用场景。
机器之心
2020/04/28
9760
强力推荐!飞桨产业级PaddleCV最新全景图
导读:PaddleCV是飞桨开源的产业级CV工具与预训练模型集,提供了依托于百度实际产品打磨,能够极大地方便 CV 研究者和工程师快速应用。使用者可以使用PaddleCV 快速实现图像分类、目标检测、图像分割、视频分类和动作定位、图像生成、度量学习、场景文字识别和关键点检测8大类任务,并且可以直接使用百度开源工业级预训练模型进行快速应用于工业、农业、医疗、零售、媒体、驾驶等领域。用户在极大地减少研究和开发成本的同时,也可以获得更好的基于产业实践的应用效果。
用户1386409
2019/09/26
1.3K0
强力推荐!飞桨产业级PaddleCV最新全景图
太炸了!摸鱼AI小游戏,你也可以上一打了!Github
今天给大家分享一款 AI 小游戏:『寻物大作战』,这款游戏是基于 GitHub 上两个开源项目实现的。
张晓衡
2021/12/01
7400
太炸了!摸鱼AI小游戏,你也可以上一打了!Github
134个预训练模型、精度高达85.1%,百度视觉算法最强基石PaddleClas全新升级
机器之心发布 机器之心编辑部 百度 PaddlePaddle 团队开发的 PaddleClas 是一个适用于业界和学界的图像分类任务工具集,可以帮助用户训练更好的计算机视觉模型并应用于真实场景中。近期 PaddleClas 迎来了全面升级,其中提供了更高精度的知识蒸馏模型、更丰富的模型种类以及更佳的开发体验,从而使得开发者更方便地在服务器端或者移动端、IoT 端进行部署。 图像分类任务作为深度学习视觉领域的「基石」,几乎是每一位视觉方向开发者最先要学习的基础本领。众所周知,图像分类已广泛应用在智慧零售、智慧
机器之心
2023/03/29
6590
134个预训练模型、精度高达85.1%,百度视觉算法最强基石PaddleClas全新升级
推荐阅读
18M 超轻量图像识别系统,商品、车辆、人脸识别一网打尽!
9180
GitHub 斩获 3100+ Star,国人开源的这个图像识别系统好用到爆!!!
5.4K0
我们做了一个智能零售结算平台
9680
智慧零售产业应用实战,30分钟上手的高精度商品识别
8010
人员出入管理效率如何提升?超轻量图像分类方案详解
3380
手把手教学电瓶车进电梯检测、多类别车辆追踪、异常行为检测产业级应用
4610
30倍加速,3毫秒急速识别,人、车、OCR等9大分类任务一网打尽
7630
AI+社区智能管理,赋能智慧城市人情共「智」
8030
全球首个「开源图像识别系统」上线了!
9640
一行代码完成模型训练,30倍加速,3毫秒急速识别,超强图像分类算法开源!
5000
效果提升7%、速度增加220%,OCR开源神器PaddleOCR再迎升级
3.4K0
毫秒级预测,性能卓越!检测、跟踪、行为识别都搞定!这套行人分析系统重磅开源!
1.2K0
物体识别技术长篇研究
2K0
Google AI地标检索识别竞赛双料获胜方案 | 飞桨PaddlePaddle开源
1.1K0
超越YOLO v5的最强算法矩阵来啦!PP-YOLOE、PP-PicoDet 云边端一网打尽!
1.2K0
精度45.9%,推理速度72.9FPS,百度飞桨推出工业级目标检测模型 PP-YOLO
8480
23个系列分类网络,10万分类预训练模型,这是飞桨PaddleClas百宝箱
9760
强力推荐!飞桨产业级PaddleCV最新全景图
1.3K0
太炸了!摸鱼AI小游戏,你也可以上一打了!Github
7400
134个预训练模型、精度高达85.1%,百度视觉算法最强基石PaddleClas全新升级
6590
相关推荐
18M 超轻量图像识别系统,商品、车辆、人脸识别一网打尽!
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档