专栏首页唐国梁Tommy深度学习目标检测与识别 YOLO_v3 自定义数据集训练

深度学习目标检测与识别 YOLO_v3 自定义数据集训练

哈喽,大家好,我是唐国梁Tommy,今天我们看一下YOLO v3的自定义数据集训练案例操作。

【预告:目前正在准备YOLO v3 -- YOLO v5的专题课程,包括 算法理论+论文解读+算法实践+python代码复现,预计六月底上线。】

这里参考的YOLO v3实现项目地址如下:https://github.com/ultralytics/yolov3

今天的案例操作流程是,我将从零开始搭建虚拟环境,一步一步操作一直到运行案例成功,适合小白同学入门、实操。

【另外两篇有关YOLO v3环境配置:

  1. 目标检测与识别框架 YOLO v3 环境配置避坑指南
  2. 小白入门,手把手教你用YOLO-v3进行目标检测与识别

我的电脑配置环境如下:

系统:Ubuntu 20.04.2 LTS

GPU:RTX 3080, 10G

NVIDIA配置:

① NVIDIA-SMI 465.19.01

② Driver Version: 465.19.01

③ CUDA Version: 11.3

Python版本:Python 3.8.5

torch版本:1.8.1+cu111

torchvision 版本:0.9.1+cu111

opencv-python 版本:4.5.1.48

具体操作流程:

1. 启动命令行窗口

2. 在本机安装虚拟环境: pip install virtualenv

3. 创建虚拟环境: virtualenv YOLO

4. 启动虚拟环境: source YOLO/bin/activate

5. 查看虚拟环境中已默认安装的库/包: pip list

6. 下载 ultralytics/yolov3,命令如下:

git clone https://github.com/ultralytics/yolov3

7. 根据配置文件requirements.txt安装相应的软件包,命令如下:

cd yolov3

pip install -r requirements.txt

8. 下载coco128数据集,该数据集是COCO2017训练数据集前128张图片构成。命令如下:

wget https://github.com/ultralytics/yolov5/releases/download/v1.0/coco128.zip

9. 解压coco128.zip,命令: unzip coco128.zip

10. 查看coco128数据集,命令如下:

11. 基于coco128训练模型,输入命令如下:

python train.py --img 640 --batch 16 --epochs 5 --data coco128.yaml --weights yolov3.pt

【注意:先到该网址下下载预训练模型,】

【报错啦,CUDA error,这个原因主要是因为torch, cuda, torchvision版本不一致引起的。需要卸载后,重新安装。由CUDA引起的问题非常头疼,往往需要折腾很久。】

解决措施:进入pytorch官网:https://pytorch.org/

根据自己的电脑系统和CUDA版本配置,选择对应的torch, torchvision, torchaudio

安装命令:

pip3 install torch==1.8.1+cu111 torchvision==0.9.1+cu111 torchaudio==0.8.1 -f https://download.pytorch.org/whl/torch_stable.html

重新执行训练coco128数据集的命令:

python train.py --img 640 --batch 16 --epochs 5 --data coco128.yaml --weights yolov3.pt

运行成功后,结果如上截图。

【注意:如果报错,显示CUDA out of memory,那么,调小 batch 的大小,我设置的是 --batch 8,即命令如下:

python train.py --img 640 --batch 8 --epochs 5 --data coco128.yaml --weights yolov3.pt 】

如果你还遇到其它问题,建议去作者GitHub的issues里面搜索, https://github.com/ultralytics/yolov3/issues 。如果没有类似的答案,自己百度或google啦,我也是这样做的。遇到Errors并不可怕,可怕的是我们不知所措,加油】

更多AI相关课程,请在网易云课堂和B站关注账号:唐国梁Tommy

网易云课堂:

https://study.163.com/instructor/1028614893.htm?_trace_c_p_k2_=a8d2f7653bf94cd5a821036a432179e4

B站:

https://space.bilibili.com/47434724

本文分享自微信公众号 - 唐国梁Tommy(TangGuoLiangAI),作者:唐国梁Tommy

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2021-04-24

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • YOLO目标检测,训练自己的数据集(识别海参)

    这篇文章是训练YOLO v2过程中的经验总结,我使用YOLO v2训练一组自己的数据,训练后的model,在阈值为.25的情况下,Recall值是95.54%,...

    机器学习AI算法工程
  • One-stage目标检测算法综述

    首先将图片 Resize 到固定尺寸,然后通过一套卷积神经网络,最后接上 FC 直接输出结果,这就他们整个网络的基本结构。

    AI研习社
  • 手把手教你用深度学习做物体检测(一): 快速感受物体检测的酷炫

    如上图所示, 物体检测就是需要检测出图像中有哪些目标物体,并且框出其在图像中的位置。

    程序员一一涤生
  • 03.结构化机器学习项目 W2.机器学习策略(2)

    几乎所有的机器学习程序可能会有50个不同的方向可以前进,并且每个方向都是相对合理的,可以改善你的系统?如何集中精力

    Michael阿明
  • 王晓刚:图像识别中的深度学习

    用户1737318
  • 图像分类:一个更鲁棒的场景分类模型

    移动互联网时代的开启使得图片的获取与分享越来越容易,图片已经成为人们交互的重要媒介。如何根据图像的视觉内容为图像赋予一个语义类别(例如,教室、街道等)是图像场景...

    机器学习AI算法工程
  • 一文带你读懂计算机视觉

    最近,我已经阅读了很多与计算机视觉相关的资料并做了大量实验,这里介绍了在该领域学习和使用过程中有意思的内容。

    AI研习社
  • 我用飞桨做了一个可回收垃圾材料分类机

    随着社会生产力的发展,工业化、城镇化的兴起和人口增加,人类社会产生的垃圾与日俱增,加剧了全球范围内的资源短缺和环境污染,对自然环境和人体健康带来了巨大的挑战。

    用户1386409
  • Python人工智能鉴黄师的自我修养

    專 欄 ❈LucasX,Python中文社区专栏作者。 ❈ 前阵子在设计一个智能黄反识别的方案,查阅了已有Paper,结合自己的一点想法,现对不良图像的识别进...

    Python中文社区
  • 最新图文识别技术综述

    牛小明为四川长虹电器股份有限公司的资深专家,也跟CV君一样曾供职于华为,是两个可爱宝贝的父亲,研究领域涉及图像、语音、文本信号处理和机器人等,Tel:15882...

    CV君
  • 人脸识别:理论、建模、应用

    面部是人体的独特标识,每个人都有着独特的面部特征。通过一个人的面部可以识别出其身份,不过双胞胎可能有点困难。那么什么是面部识别系统?简单来说,面部识别系统是一种...

    深度学习与Python
  • 在Jetson NANO 2GB 上运行Hello AI World

    我们将用几篇文章为读者讲解 NVIDIA 的 Jetson-inference,这个对于初学者尤为实用。本篇文章就来为大家介绍 Hello AI World。

    GPUS Lady
  • 深度学习在医学影像上的应用(四)——检测

    上一篇给大家介绍了深度学习在医学影像上分割的应用,这一篇我将分享深度学习在医学影像上检测应用。

    医学处理分析专家
  • CVPR2021目标检测和语义分割论文分类汇总 | 源码 |

    今年CVPR 共有7015篇有效投稿,其中进入Decision Making阶段的共有约5900篇,最终有1663篇突出重围被接收,录用率大概为23.7%(16...

    计算机视觉
  • 深度学习的一些概念分享

    用户1130025
  • 人工智能非技术从业者必知的十件事

    原创声明:本文为 SIGAI 原创文章,仅供个人学习使用,未经允许,不得转载,不能用于商业目的。

    SIGAI学习与实践平台
  • 一文带你读懂 OCR

    OCR,或光学字符识别,是最早的计算机视觉任务之一,因为在某些方面它不需要用到深度学习。因此,早在2012年深度学习热潮之前,OCR就有了各种不同的应用,有些甚...

    AI研习社
  • 非算法类人工智能从业者须知的十件事

    AI大潮汹涌,吸引了越来越多的人才进入来添砖加瓦。而其中,除去核心的算法工程师、科学家外,催生了大量相关的从业人员。而无论你是销售,产品,设计,甚至是协作的AP...

    SIGAI学习与实践平台
  • 纯干货 | 深度学习研究综述

    先来一首《好久不见》,给大家说一声抱歉,最近因为种种的原因,没有通过“计算机视觉战队”给打开带来好的文章和知识的分享,在此,代表“计算机视觉战队”向所有关注我们...

    计算机视觉研究院

扫码关注云+社区

领取腾讯云代金券