若使用已保存好的镜像reid_mgn:v1,在本机上可按如下操作训练
# 1.进入已保存环境的镜像(reid_mgn:v1(8.48G)、pytorch/pytorch:1.0.1-cuda10.0-cudnn7-devel_mgnreid(6.37G))
nvidia-docker run -it –rm -v /home/lc-deep/sdr:/home/personReID reid_mgn:v1 /bin/bash (服务器10.10.113.130)
nvidia-docker run -it –rm –name sxue -v /home/lc-deep/sdr:/home/personReID pytorch/pytorch:1.0.1-cuda10.0-cudnn7-devel_mgnreid /bin/bash
docker attach ID
nvidia-docker run -it –rm –name mgn -v /home/deep/share2/docker_data:/home -v /home/deep/sxue:/home/personReID ufoym/deepo:testv1 /bin/bash (75服务器)
# 2.进入到工程目录
cd /home/personReID/MGN-pytorch-master
# 3.复制预训练模型到指定路径(可跳过这步)
cp /home/personReID/MGN-pytorch-master/resnet50-19c8e357.pth /root/.cache/torch/checkpoints/resnet50-19c8e357.pth
#### 注每次需查电脑自动保存的根目录 /root/.cache/torch/checkpoints/resnet50-19c8e357.pth 会因电脑不同而不同
cp /home/personReID/MGN-pytorch-master/resnet50-19c8e357.pth /root/.torch/models/resnet50-19c8e357.pth
# 打开另一个终端
docker ps 查看容器内镜像(找到reid_mgn:v1 前对应的数字字符串%%%%)
docker stats %%%%% 实时监测内存情况
# 4.训练(在原终端继续进行,注:demo.sh是已改好参数的)
sh demo1.sh
补充: 训练前需要修改的文件及代码
1.demo.sh文件
修改data路径(把你的数据集路径添加到 –datadir)、GPU、参数等如下:
CUDA_VISIBLE_DEVICES=0 python main.py –reset –datadir /home/personReID/MGN-pytorch-master/Market1501/ –batchid 4 –batchtest 16 –test_every 20 –epochs 80 –decay_type step_40_60 –loss 1*CrossEntropy+2*Triplet –margin 0.3 –re_rank –random_erasing –save MGN_adam –nGPU 1 –lr 2e-4 –optimizer ADAM –save_models
注:需将数据集文件名由原始的Market-1501-****改为和代码匹配的Market1501
2.trainer.py
修改train、test中的epoch
3.main.py
如果是单GPU训练,需按如下添加命令
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/185472.html原文链接:https://javaforall.cn