中文车牌识别系统

感谢Liuruoze的EasyPR开源车牌识别系统。

EasyPR是一个中文的开源车牌识别系统,其目标是成为一个简单、灵活、准确的车牌识别引擎。

相比于其他的车牌识别系统,EasyPR有如下特点:

  • 它基于openCV这个开源库,这意味着所有它的代码都可以轻易的获取。
  • 它能够识别中文,例如车牌为苏EUK722的图片,它可以准确地输出std:string类型的"苏EUK722"的结果。
  • 它的识别率较高。目前情况下,字符识别已经可以达到90%以上的精度。

跨平台

目前除了windows平台以外,还有以下其他平台的EasyPR版本。一些平台的版本可能会暂时落后于主平台。

现在有一个无需配置opencv的1.5版本的懒人版。仅仅支持vs2013,也只能在debug和x86下运行,其他情况的话还是得配置opencv。感谢范文捷同学的帮助。页面里的两个文件都要下载,下载后用7zip解压。

版本

开发者

版本

地址

android

goldriver

1.4

linuxxx/EasyPR_Android

linux

Micooz

1.6

已跟EasyPR整合

ios

zhoushiwei

1.3

zhoushiwei/EasyPR-iOS

mac

zhoushiwei,Micooz

1.6

已跟EasyPR整合

java

fan-wenjie

1.2

fan-wenjie/EasyPR-Java

懒人版

fan-wenjie

1.5

git/oschina

兼容性

当前EasyPR是基于opencv3.0版本开发的,3.0及以上的版本应该可以兼容,以前的版本可能会存在不兼容的现象。

例子

假设我们有如下的原始图片,需要识别出中间的车牌字符与颜色:

经过EasyPR的第一步处理车牌检测(PlateDetect)以后,我们获得了原始图片中仅包含车牌的图块:

接着,我们对图块进行OCR过程,在EasyPR中,叫做字符识别(CharsRecognize)。我们得到了一个包含车牌颜色与字符的字符串:

“蓝牌:苏EUK722”

示例

EasyPR的调用非常简单,下面是一段示例代码:

    CPlateRecognize pr;
    pr.setResultShow(false);
    pr.setDetectType(PR_DETECT_CMSER);

    vector<CPlate> plateVec;
    Mat src = imread(filepath);
    int result = pr.plateRecognize(src, plateVec);

我们首先创建一个CPlateRecognize的对象pr,接着设置pr的属性。

    pr.setResultShow(false);

这句话设置EasyPR是否打开结果展示窗口,如下图。设置为true就是打开,否则就是关闭。在需要观看定位结果时,建议打开,快速运行时关闭。

    pr.setDetectType(PR_DETECT_CMSER);

这句话设置EasyPR采用的车牌定位算法。CMER代表文字定位方法,SOBEL和COLOR分别代表边缘和颜色定位方法。可以通过"|"符号结合。

    pr.setDetectType(PR_DETECT_COLOR | PR_DETECT_SOBEL);

除此之外,还可以有一些其他的属性值设置:

    pr.setLifemode(true);

这句话设置开启生活模式,这个属性在定位方法为SOBEL时可以发挥作用,能增大搜索范围,提高鲁棒性。

    pr.setMaxPlates(4);

这句话设置EasyPR最多查找多少个车牌。当一副图中有大于n个车牌时,EasyPR最终只会输出可能性最高的n个。

下面来看pr的方法。plateRecognize()这个方法有两个参数,第一个代表输入图像,第二个代表输出的车牌CPlate集合。

    vector<CPlate> plateVec;
    Mat src = imread(filepath);
    int result = pr.plateRecognize(src, plateVec);

当返回结果result为0时,代表识别成功,否则失败。

CPlate类包含了车牌的各种信息,其中重要的如下:

    CPlate plate = plateVec.at(i);
    Mat plateMat = plate.getPlateMat();
    RotatedRect rrect = plate.getPlatePos();
    string license = plate.getPlateStr();

plateMat代表车牌图像,rrect代表车牌的可旋转矩形位置,license代表车牌字符串,例如“蓝牌:苏EUK722”。

这里说下如何去阅读如下图的识别结果。

第1行代表的是图片的文件名。

第2行代表GroundTruth车牌,用后缀(g)表示。第3行代表EasyPR检测车牌,用后缀(d)表示。两者形成一个配对,第4行代表两者的字符差距。

下面同上。本图片中有3个车牌,所有共有三个配对。最后的Recall等指标代表的是整幅图片的定位评价,考虑了三个配对的结果。

有时检测车牌的部分会用“无车牌”与“No string”替代。“无车牌”代表“定位不成功”,“No string”代表“定位成功但字符分割失败”。

版权

EasyPR的源代码与训练数据遵循Apache v2.0协议开源。

EasyPR的resources/image/general_test文件夹下的图片数据遵循GDSL协议(通用数据共享协议)进行开放。

请确保在使用前了解以上协议的内容。

目录结构

以下表格是本工程中所有目录的解释:

目录

解释

src

所有源文件

include

所有头文件

test

测试程序

model

机器学习的模型

resources/text

中文字符映射表

resources/train

训练数据与说明

resources/image

测试用的图片

resources/doc

相关文档

tmp

训练数据读取目录,需要自建

以下表格是resources/image目录中子目录的解释:

目录

解释

general_test

GDTS(通用数据测试集)

native_test

NDTS(本地数据测试集)

tmp

Debug模式下EasyPR输出中间图片的目录,需要自建

以下表格是src目录中子目录的解释:

目录

解释

core

核心功能

preprocess

SVM预处理

train

训练目录,存放模型训练的代码

util

辅助功能

以下表格是src目录下一些核心文件的解释与关系:

文件

解释

plate_locate

车牌定位

plate_judge

车牌判断

plate_detect

车牌检测,是车牌定位与车牌判断功能的组合

chars_segment

字符分割

chars_identify

字符鉴别

chars_recognise

字符识别,是字符分割与字符鉴别功能的组合

plate_recognize

车牌识别,是车牌检测与字符识别的共有子类

feature

特征提取回调函数

plate

车牌抽象

core_func.h

共有的一些函数

以下表格是test目录下文件的解释:

文件

解释

main.cpp

主命令行窗口

accuracy.hpp

批量测试

chars.hpp

字符识别相关

plate.hpp

车牌识别相关

以下表格是train目录下文件的解释:

文件

解释

ann_train.cpp

训练二值化字符

annCh_train.hpp

训练中文灰度字符

svm_train.hpp

训练车牌判断

create_data.hpp

生成合成数据

获取帮助

详细的开发与教程请在微信恢复“车牌识别”。

Contributors

  • liuruoze:1.0-1.2,1.5版作者
  • 海豚嘎嘎(车主之家):1.3版算法贡献者,提升了车牌定位与字符识别的准确率
  • Micooz:1.3-1.4版架构重构,linux与mac支持,opencv3.0支持,utf-8编码转换
  • jsxyhelu:deface版本一
  • zhoushiwei:deface版本二
  • ahccom:新的plateLocate函数
  • 阿水:1.3版整合,数据标注等工作
  • fan-wenjie:1.5版opencv整合版提供者
  • Free:1.6版数据提供者

原文发布于微信公众号 - 计算机视觉战队(ComputerVisionGzq)

原文发表时间:2017-06-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技评论

开发 | 用PyTorch还是TensorFlow?斯坦福大学CS博士生带来全面解答

AI 科技评论按:关于深度学习的框架之争一直没有停止过。PyTorch,TensorFlow,Caffe还是Keras ?近日, 斯坦福大学计算机科学博士生Aw...

47560
来自专栏计算机视觉与深度学习基础

DBLP数据集简介及简单用法

前一段时间利用大名鼎鼎的DBLP数据集做关于论文合作关系推荐的实验,感觉确实是一个非常不错的数据集,可挖掘的东西很多很多,在此对DBLP及其用法做一个简单介绍。...

91250
来自专栏华章科技

Python爬虫新手进阶版:怎样读取非结构化网页、图像、视频、语音数据

导读:常见的数据来源和获取方式,你或许已经了解很多。本文将拓展数据来源方式和格式的获取,主要集中在非结构化的网页、图像、视频和语音。

23030
来自专栏PPV课数据科学社区

PyTorch和TensorFlow哪家强:九项对比读懂各自长项短板

近日,斯坦福大学计算机科学系博士生 Awni Hannun 也发表了一篇文章,谈了自己对 PyTorch 和 TensorFlow 这两大明星框架的心得体验,并...

48960
来自专栏大数据文摘

手把手 | 如何在你的iPhone上建立第一个机器学习模型(Apple最新CoreML框架入门)

42950
来自专栏AI科技评论

开发 | 紧跟未来深度学习框架需求,TensorFlow推出Eager Execution

AI科技评论按:Google的TensorFlow是AI学习者中使用率最高、名气也最大的深度学习框架,但由于TensorFlow最早是基于Google的需求开发...

36060
来自专栏新智元

DeepMind 开源内部深度学习框架 Sonnet,研究通过梯度下降学习

【新智元导读】DeepMind 今天开源了最新的深度学习框架 Sonnet。Sonnet 被专门设计用于与 TensorFlow 协同工作,能够更方便、直接地构...

32830
来自专栏机器之心

深度 | PyTorch和TensorFlow哪家强:九项对比读懂各自长项短板

选自GitHub 作者:Awni Hannun 机器之心编译 参与:Panda 现在是各种机器学习框架群雄争霸的时代,各种各样的比较文章也层出不穷。近日,斯坦福...

35460
来自专栏新智元

【TensorFlow重大升级】自动将Python代码转为TF Graph,大幅简化动态图处理!

作者:Alex Wiltschko, Dan Moldovan, Wolff Dobson

14420
来自专栏云时之间

机器学习资料合计(一)

最近在群里发现一些小伙伴在寻找资料的时候总是无处可找,网上出现很多收集免费资料再去打包收钱的人,我看不惯这样的人,所以把自己收集的文件分享给大家。百度云经常抽风...

40280

扫码关注云+社区

领取腾讯云代金券