图像识别作为深度学习算法的主流实践应用方向,早已在生活的各个领域发挥作用,如安全检查和身份核验时的人脸识别、无人货架和智能零售柜中的商品识别,这些任务背后的关键技术都在于此。
图1 PP-ShiTu应用于商品识别效果示意(开发者应用展示)
然而实现理想的识别效果并不是一件简单的事:
PP-ShiTu核心技术解读
针对以上技术难点,PaddleClas推出的通用图像识别系统PP-ShiTu均可以完美解决,它不仅有高水平的特征学习能力,对新出现的类别也可以在不用重新训练算法的情况下,直接通过配置检索库的方式实现识别。
⭐ 项目链接 ⭐
https://github.com/PaddlePaddle/PaddleClas
PaddleClas所有源码及教程均已开源,欢迎大家使用,并Star鼓励~
这样的特殊能力,得益于PP-ShiTu引入目标检测、度量学习、图像检索等技术,并将每个模块性能最大化,才构建成了统一、通用的图像识别系统:
图2 PP-ShiTu架构示意图
图3 PP-PicoDet在 COCO2017-val上的 mAP 对比
图4 训练数据及部分测试数据示例
图5 端侧新类别建立索引流程(开发者应用展示)
升级版PP-ShiTu欢迎使用
时隔数月,PaddleClas 新版本v2.3.1为大家带来了更加轻量化的图像识别系统PP-ShiTu。核心功能点如下:
图6 手机识别效果展示(开发者应用展示)
PP-ShiTu的使用也是十分简单、方便,在完成环境配置后只需三步即可完成快速体验:
第一步:下载 Inference 模型
第二步:构建索引
第三步:完成单张/批量图像识别
详细文档,请参考:
https://github.com/PaddlePaddle/PaddleClas/blob/release/2.3/docs/zh_CN/quick_start/quick_start_recognition.md
更有完整流程演示,可参考AI Studio项目:https://aistudio.baidu.com/aistudio/projectdetail/3445604
共建开源生态
自PP-ShiTu发布以来,引起了众多开发者的广泛关注。华东理工大学的高材生颜鑫,也是飞桨领航团的团长,带领团队基于PP-ShiTu开发了一套智能购物平台系统:通过图像即可精准识别顾客购买的商品,并返回完整的购物清单及应付价格,为智能货柜提供了非常好的视觉化解决方案。
链接指路:
https://github.com/thomas-yanxin/Smart_container
图7 智能结算平台架构示意图
与此同时,我们也力求为开源社区的繁荣作出贡献,希望PP-ShiTu的算法本身以及优化思路,可以在给业界开发者带来更好网络的同时,也带来更多的算法优化启发,为中国的开源发展贡献一份力量。
如果您想详细了解更多飞桨的相关内容,请参阅以下文档。
官网地址:
https://www.paddlepaddle.org.cn
PaddleClas项目地址:
GitHub:
https://github.com/PaddlePaddle/PaddleClas/tree/develop
Gitee:
https://gitee.com/paddlepaddle/PaddleClas
本文分享自 PaddlePaddle 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有