前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >PaddleOCR 训练模型参考

PaddleOCR 训练模型参考

作者头像
沙漠尽头的狼
发布2022-04-18 20:15:37
1.1K0
发布2022-04-18 20:15:37
举报
文章被收录于专栏:Dotnet9Dotnet9

本文章介绍的是NV显卡训练。CPU训练 仅供参考,部分不同的地方请前往官方网站获取信息。

官方地址:

  • https://github.com/PaddlePaddle/PaddleOCR[1]
  • https://gitee.com/paddlepaddle/PaddleOCR[2]

必须要安装的环境

  • Python 3.9(3.10):初期测试一直有问题后作者改为3.9,如果有需要自行验证3.10https://www.python.org/[3]
  • Python:是执行脚本的关键词,需要配置环境变量,下面的很多组件都需要配置环境变量,具体的请参考互联网信息。
  • pip: 作者本身不会Python,这个理解应该是一个安装的插件。可以安装第三方库,如果pip3无法执行 可以切换成pip,具体原因不明。
  • pip 网络问题: 可以在使用pip的时候加参数-i https://pypi.tuna.tsinghua.edu.cn/simple[4]

例如:pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pyspider,这样就会从清华这边的镜像去安装pyspider库。

  • CUDA

https://developer.nvidia.com/cuda-downloads[5]

作者安装的是10.2的版本

  • CUDNN

https://developer.nvidia.com/cudnn[6]

下载之后覆盖保存到CUDA目录

  • PaddleOCR

https://github.com/PaddlePaddle/PaddleOCR[7]

把项目克隆到本地

  • cd PaddleOCR
代码语言:javascript
复制
pip3 install -r requirements.txt

安装OCR需要的第三方python库

  • PPOCRLabel

这是创建学习数据的,标注工具,不是必要的,但是很方便。

代码语言:javascript
复制
cd ./PPOCRLabel # 将目录切换到PPOCRLabel文件夹下
pip install pyqt5 # 安装QT5 运行环境
pip3 install -r requirements.txt  
python PPOCRLabel.py --lang ch # 启动工具,如果启动没反应那么就是缺少环境
  • ch_ppocr_mobile_v2.0_rec

预训练模型(其他模型可以参考地址:models_list.md[8]

ch_ppocr_mobile_v2.0_rec_pre.tar[9]

  • 训练参数文档

config.md[10]

本地配置文件路径: PaddleOCR-release-2.4\configs\rec\ch_ppocr_v2.0\rec_chinese_lite_train_v2.0.yml

  • 修改的值:
代码语言:javascript
复制
epoch_num: 1000 #循环次数
data_dir: ./train_data/ #训练数据目录
label_file_list: ["./train_data/train_list.txt"] #训练数据的比对文本
batch_size_per_card: 128 #使用的数量(太大启动不起来,可以自行修改)
  • 训练目录解释
代码语言:javascript
复制
PaddleOCR-release-2.4\train_data
PaddleOCR-release-2.4\train_data\crop_img #用工具做好的图片放到这里
PaddleOCR-release-2.4\train_data\train_list.txt #训练的文本信息
PaddleOCR-release-2.4\train_data\val_list.txt   #验证文本信息 (目前作者使用的和训练文本一样的内容)内容如下
![](https://img1.dotnet9.com/2022/03/A6.png)
PaddleOCR-release-2.4\pretrain_models  #从官网下载的预训练模型放到这里
PaddleOCR-release-2.4\output #训练输出目录
PaddleOCR-release-2.4\output\inference #最终导出模型
  • 训练脚本
代码语言:javascript
复制
//训练模型
python tools/train.py -c configs/rec/ch_ppocr_v2.0/rec_chinese_lite_train_v2.0.yml -o Global.pretrained_model=./pretrain_models/best_accuracy
代码语言:javascript
复制
//导出模型
python tools/export_model.py -c configs/rec/ch_ppocr_v2.0/rec_chinese_lite_train_v2.0.yml -o Global.checkpoints=output/rec_chinese_lite_v2.0/latest Global.save_inference_dir=output/inference
代码语言:javascript
复制
//使用训练预测(预测文件夹)
python tools/infer_rec.py -c configs/rec/ch_ppocr_v2.0/rec_chinese_lite_train_v2.0.yml -o Global.checkpoints=output/rec_chinese_lite_v2.0/latest Global.load_static_weights=false Global.infer_img=trainTest/ 
代码语言:javascript
复制
//使用训练预测(预测单个文件)
python tools/infer_rec.py -c configs/rec/ch_ppocr_v2.0/rec_chinese_lite_train_v2.0.yml -o Global.checkpoints=output/rec_chinese_lite_v2.0/latest Global.load_static_weights=false Global.infer_img=trainTest/1000.jpg
代码语言:javascript
复制
//使用导出模型预测
python tools/infer/predict_rec.py --image_dir="./trainTest/" --det_model_dir="./ch_PP-OCRv2_det_infer/"  --rec_model_dir="./output/inference/" --cls_model_dir="./ch_ppocr_mobile_v2.0_cls_infer/"  
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-03-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Dotnet9 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 官方地址:
  • 必须要安装的环境
相关产品与服务
文字识别
文字识别(Optical Character Recognition,OCR)基于腾讯优图实验室的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档