
本项目基于PaddleOCR v5,使用Paddle Inference和OpenCV实现中英文文本检测与识别,支持方向分类,适合在Windows平台下进行二次开发和部署。
x86-64_cuda11.8_cudnn8.9.7_mkl_avx_vs2019-paddle_inference-3.0.0目录已存在。将以下模型文件夹放入model/目录下:
PP-OCRv5_mobile_det:文本检测模型PP-OCRv5_mobile_rec:文本识别模型ch_ppocr_mobile_v2.0_cls_infer:方向分类模型ppocr_keys.txt:字典文件修改CMakeLists.txt中的如下路径为你本地实际路径(注意不要有中文或空格):
SET(PADDLE_LIB "C:\\你的路径\\x86-64_cuda11.8_cudnn8.9.7_mkl_avx_vs2019-paddle_inference-3.0.0")
SET(OpenCV_DIR "D:\\你的路径\\opencv\\build\\x64\\vc16\\lib")使用CMake生成VS工程或直接编译:
mkdir build
cd build
cmake ..
cmake --build . --config Release编译完成后,build/Release/目录下会生成ppocr.exe及所需DLL。
切换到build/Release/目录。
执行如下命令(请将路径替换为你实际的模型和图片路径):
ppocr.exe \
--det_model_dir=C:\路径\model\PP-OCRv5_mobile_det \
--rec_model_dir=C:\路径\model\PP-OCRv5_mobile_rec \
--cls_model_dir=C:\路径\model\ch_ppocr_mobile_v2.0_cls_infer \
--image_dir=C:\路径\2.jpg \
--use_angle_cls=true --det=true --rec=true --cls=true \
--rec_char_dict_path=C:\路径\model\ppocr_keys.txt \
--use_gpu=true结果会在命令行输出,若开启--visualize=true,检测结果图片会保存在--output指定目录。
--det_model_dir:检测模型目录--rec_model_dir:识别模型目录--cls_model_dir:方向分类模型目录--image_dir:待识别图片路径或目录--rec_char_dict_path:字典文件路径--use_angle_cls:是否使用方向分类--det:是否启用文本检测--rec:是否启用文本识别--cls:是否启用方向分类--use_gpu:是否使用GPU推理--output:结果输出目录(可选)main.cpp和源码注释build/Release/下有paddle_inference.dll、common.dll、mkldnn.dll、libiomp5md.dll、mklml.dll等。src/main.cpp,可根据实际需求修改参数或调用流程。src/paddleocr.cpp,支持批量图片识别、检测、方向分类等。PPOCR类的接口。