OpenCV人脸识别之二:模型训练

本系列人脸识别文章用的是opencv2,最新版的opencv3.2的代码请参考文章:

OpenCV之识别自己的脸——C++源码放送(请在上一篇文章末尾查看)

在该系列第一篇《OpenCV人脸识别之一:数据收集和预处理》文章中,已经下载了ORL人脸数据库,并且为了识别自己的人脸写了一个拍照程序自拍。之后对拍的照片进行人脸识别和提取,最后我们得到了一个包含自己的人脸照片的文件夹s41。在博客的最后我们提到了一个非常重要的文件——at.txt。

1、csv文件的生成

当我们写人脸模型的训练程序的时候,我们需要读取人脸和人脸对应的标签。直接在数据库中读取显然是低效的。所以我们用csv文件读取。csv文件中包含两方面的内容,一是每一张图片的位置所在,二是每一个人脸对应的标签,就是为每一个人编号。这个at.txt就是我们需要的csv文件。生成之后它里面是这个样子的:

前面是图片的位置,后面是图片所属人脸的人的标签。

要生成这样一个文件直接用手工的方式一个一个输入显然不可取的,毕竟这里有400多张图片。而且这种重复性的工作估计也没人想去做。所以我们可以用命令行的方式简化工作量;或者用opencv自带的Python脚本来自动生成。

命令行方式是这样的。比如我的数据集在C:\Users\bingbuyu\Downloads\att_faces文件夹下面,我就用下面两行命令:

然后数据集文件夹下面就多出了一个at.txt文件,但是现在是只有路径没有标签的。像下面这样:

标签需要手动敲上去。。。也挺麻烦的。

好在opencv教程里面为我们提供了自动生成csv文件的脚本。路径类似这样:F:\opencv\sources\modules\contrib\doc\facerec\src\create_csv.py。我不知道怎么用命令行参数的形式运行Python脚本,所以只能把代码里面的BASE_PATH手动的改成自己的数据集路径,改完大致是这样:

#!/usr/bin/env python
 import sys
import os.path
 # This is a tiny script to help you creating a CSV file from a face
# database with a similar hierarchie:
#
#  philipp@mango:~/facerec/data/at$ tree
#  .
#  |-- README #  |-- s1
#  |   |-- 1.pgm #  |   |-- ...
#  |   |-- 10.pgm
 #  |-- s2
#  |   |-- 1.pgm
#  |   |-- ...
#  |   |-- 10.pgm
#  ...
#  |-- s40
 #  |   |-- 1.pgm
#  |   |-- ...
#  |   |-- 10.pgm
#
 if __name__ == "__main__":      
#if len(sys.argv) != 2:     
#    print "usage: create_csv <base_path>"     
#    sys.exit(1)      
#BASE_PATH=sys.argv[1]     
BASE_PATH="C:/Users/bingbuyu/Downloads/att_faces"      
SEPARATOR=";"      
fh = open("../etc/at.txt",'w')      
label = 0     
for dirname, dirnames, filenames in os.walk(BASE_PATH):         
for subdirname in dirnames:             
subject_path = os.path.join(dirname, subdirname)             
for filename in os.listdir(subject_path):                 
abs_path = "%s/%s" % (subject_path, filename)                 
print "%s%s%d" % (abs_path, SEPARATOR, label)                
 fh.write(abs_path)                 
fh.write(SEPARATOR)                
 fh.write(str(label))                
 fh.write("\n")                   
label = label + 1
 fh.close()

然后运行这个脚本就可以生成一个既有路径又有标签的at.txt了。

2、训练模型

现在数据集、csv文件都已经准备好了。接下来要做的就是训练模型了。

这里我们用到了opencv的Facerecognizer类。opencv中所有的人脸识别模型都是来源于这个类,这个类为所有人脸识别算法提供了一种通用的接口。文档里的一个小段包含了我们接下来要用到的几个函数:

OpenCV 自带了三个人脸识别算法:Eigenfaces,Fisherfaces 和局部二值模式直方图 (LBPH)。这里先不去深究这些算法的具体内容,直接用就是了。如果有兴趣可以去看相关论文。接下来就分别训练这三种人脸模型。这个时候就能体现出Facerecognizer类的强大了。因为每一种模型的训练只需要三行代码:

  Ptr<FaceRecognizer> model = createEigenFaceRecognizer();     model->train(images, labels);     model->save("MyFacePCAModel.xml");      Ptr<FaceRecognizer> model1 = createFisherFaceRecognizer();     model1->train(images, labels);     model1->save("MyFaceFisherModel.xml");      Ptr<FaceRecognizer> model2 = createLBPHFaceRecognizer();     model2->train(images, labels);     model2->save("MyFaceLBPHModel.xml");
当然在这之前要先把之前图片和标签提取出来。这时候就是at.txt派上用场的时候了。
//使用CSV文件去读图像和标签,主要使用stringstream和getline方法
static void read_csv(const string& filename, vector<Mat>& images, vector<int>& labels, char separator = ';') {     
std::ifstream file(filename.c_str(), ifstream::in);     
if (!file) {         
string error_message = "No valid input file was given, please check the given filename.";         CV_Error(CV_StsBadArg, error_message);     
}     
string line, path, classlabel;     
while (getline(file, line)) {         
stringstream liness(line);         
getline(liness, path, separator);         
getline(liness, classlabel);        
 if (!path.empty() && !classlabel.empty()) {             
images.push_back(imread(path, 0));             
labels.push_back(atoi(classlabel.c_str()));        
 }
    }
}

在模型训练好之后我们拿数据集中的最后一张图片做一个测试,看看结果如何。

Mat testSample = images[images.size() - 1]; int testLabel = labels[labels.size() - 1]; <span style="white-space:pre"> </span>//。。。。这里省略部分代码。。。。。。。。 // 下面对测试图像进行预测,predictedLabel是预测标签结果 int predictedLabel = model->predict(testSample); int predictedLabel1 = model1->predict(testSample); int predictedLabel2 = model2->predict(testSample); // 还有一种调用方式,可以获取结果同时得到阈值: // int predictedLabel = -1; // double confidence = 0.0; // model->predict(testSample, predictedLabel, confidence); string result_message = format("Predicted class = %d / Actual class = %d.", predictedLabel, testLabel); string result_message1 = format("Predicted class = %d / Actual class = %d.", predictedLabel1, testLabel); string result_message2 = format("Predicted class = %d / Actual class = %d.", predictedLabel2, testLabel); cout << result_message << endl; cout << result_message1 << endl; cout << result_message2 << endl;

由于本来的数据集中是40个人,加上自己的人脸集就是41个。标签是从0开始标的,所以在这里我是第40个人。也即是说Actual class应该40。Predicted class也应该是40才说明预测准确。这里我们可以看到结果:

结果正确。

模型训练的全部代码:

//#include "stdafx.h"
#include <opencv2/opencv.hpp>
 #include <iostream>
#include <fstream>
#include <sstream>
#include <math.h>
using namespace cv;
using namespace std;
static Mat norm_0_255(InputArray _src) {     
Mat src = _src.getMat();     
// 创建和返回一个归一化后的图像矩阵:     
Mat dst;     
switch (src.channels()) {     
case1:         
cv::normalize(_src, dst, 0, 255, NORM_MINMAX, CV_8UC1);         
break;     
case3:        
 cv::normalize(_src, dst, 0, 255, NORM_MINMAX, CV_8UC3);         
break;     
default:         
src.copyTo(dst);        
break;     
}    
 return dst; }
//使用CSV文件去读图像和标签,主要使用stringstream和getline方法
static void read_csv(const string& filename, vector<Mat>& images, vector<int>& labels, char separator = ';') {     
std::ifstream file(filename.c_str(), ifstream::in);     
if (!file) {         
string error_message = "No valid input file was given, please check the given filename.";         CV_Error(CV_StsBadArg, error_message);    
 }     
string line, path, classlabel;     
while (getline(file, line)) {         
stringstream liness(line);         
getline(liness, path, separator);         
getline(liness, classlabel);         
if (!path.empty() && !classlabel.empty()) {             
images.push_back(imread(path, 0));             
labels.push_back(atoi(classlabel.c_str()));        
 }   
  }
 }
 int main()
 {     
//读取你的CSV文件路径.     
//string fn_csv = string(argv[1]);     
string fn_csv = "at.txt";     
// 2个容器来存放图像数据和对应的标签     
vector<Mat> images;     
vector<int> labels;     
// 读取数据. 如果文件不合法就会出错     
// 输入的文件名已经有了.    
 try    
 {         
read_csv(fn_csv, images, labels);     
}    
 catch (cv::Exception& e)     
{         
cerr << "Error opening file \"" << fn_csv << "\". Reason: " << e.msg << endl;         
// 文件有问题,我们啥也做不了了,退出了         
exit(1);     
}     
// 如果没有读取到足够图片,也退出.    
 if (images.size() <= 1) {         
string error_message = "This demo needs at least 2 images to work. Please add more images to your data set!";         
CV_Error(CV_StsError, error_message);     
}     
// 下面的几行代码仅仅是从你的数据集中移除最后一张图片     
//[gm:自然这里需要根据自己的需要修改,他这里简化了很多问题]     
Mat testSample = images[images.size() - 1];     
int testLabel = labels[labels.size() - 1];     
images.pop_back();     
labels.pop_back();     
// 下面几行创建了一个特征脸模型用于人脸识别,     
// 通过CSV文件读取的图像和标签训练它。    
 // T这里是一个完整的PCA变换     
//如果你只想保留10个主成分,使用如下代码    
 //      cv::createEigenFaceRecognizer(10);     
//     
// 如果你还希望使用置信度阈值来初始化,使用以下语句:    
 //      cv::createEigenFaceRecognizer(10, 123.0);     
//     
// 如果你使用所有特征并且使用一个阈值,使用以下语句:    
 //      cv::createEigenFaceRecognizer(0, 123.0);     
Ptr<FaceRecognizer> model = createEigenFaceRecognizer();     
model->train(images, labels);     
model->save("MyFacePCAModel.xml");     
Ptr<FaceRecognizer> model1 = createFisherFaceRecognizer();     
model1->train(images, labels);     
model1->save("MyFaceFisherModel.xml");    
 Ptr<FaceRecognizer> model2 = createLBPHFaceRecognizer();     
model2->train(images, labels);     
model2->save("MyFaceLBPHModel.xml");    
 // 下面对测试图像进行预测,predictedLabel是预测标签结果    
int predictedLabel = model->predict(testSample);    
 int predictedLabel1 = model1->predict(testSample);     
int predictedLabel2 = model2->predict(testSample);     
// 还有一种调用方式,可以获取结果同时得到阈值:     
//      int predictedLabel = -1;     
//      double confidence = 0.0;     
//      model->predict(testSample, predictedLabel, confidence);     
string result_message = format("Predicted class = %d / Actual class = %d.", predictedLabel, testLabel);     
string result_message1 = format("Predicted class = %d / Actual class = %d.", predictedLabel1, testLabel);     
string result_message2 = format("Predicted class = %d / Actual class = %d.", predictedLabel2, testLabel);     
cout << result_message << endl;

cout << result_message1 << endl;     
cout << result_message2 << endl;    
 waitKey(0);     
return 0;
 }     

原文发布于微信公众号 - 人工智能LeadAI(atleadai)

原文发表时间:2017-11-21

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏计算机视觉战队

Caffe源码---------主要框架介绍

初学者的我感觉看代码就是一个煎熬啊!但是某人说过一句话:“Don’t be afraid to read the code!”现在我写一下简单的介绍,准备给入门...

3325
来自专栏人工智能LeadAI

深度学习训练时GPU温度过高?几个命令,为你的GPU迅速降温。

新买回来的不带水冷公版GPU,在满负载运行的时候,温度从室温马上飙升到85度,而且模型训练不是几分钟完事,很有可能要长期保持在高温状态下运行,让如此昂贵的GPU...

3717
来自专栏TensorFlow从0到N

TensorFlow从0到1 - 17 - Step By Step上手TensorBoard

上一篇16 L2正则化对抗“过拟合”提到,为了检测训练过程中发生的过拟合,需要记录每次迭代(甚至每次step)模型在训练集和验证集上的识别精度。其实,为了能更...

3538
来自专栏用户2442861的专栏

caffe python 图片训练识别 实例

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/haluoluo211/article/details...

1292
来自专栏移动端周边技术扩展

coremltools安装

1423
来自专栏AI研习社

一个应用于物体识别的迁移学习工具链

迁移学习指的是,通过对预训练模型的参数进行微调,将训练好的模型应用到相似或者只有细微差异的不同任务中。通过这个方法,我们可以基于一些性能顶尖的深度学习模型得到别...

952
来自专栏IT派

酷!3行Python代码完成人脸识别

Face Recognition软件包 这是世界上最简单的人脸识别库了。你可以通过Python引用或者命令行的形式使用它,来管理和识别人脸。 该软件包使用d...

43010
来自专栏机器之心

教程 | 在Cloud ML Engine的TPU上从头训练ResNet

张量处理单元(TPU)是能够大大加快深度学习模型训练速度的硬件加速器。在斯坦福大学进行的独立测试中,在 TPU 上训练的 ResNet-50 模型能够在 Ima...

772
来自专栏AI科技评论

开发 | 深度学习训练时 GPU 温度过高?输入这几行命令就能迅速降温

AI科技评论按:本文作者胡智豪,原载于作者个人博客,AI科技评论经授权发布。 新买回来的不带水冷公版GPU,在满负载运行的时候,温度从室温马上飙升到85度,而且...

34712
来自专栏付越的专栏

深度学习入门篇--手把手教你用 TensorFlow 训练模型

最近笔者终于跑通 TensorFlow Object Detection API的ssd_mobilenet_v1 模型,这里记录下如何完整跑通数据准备到模型使...

4.3K2

扫码关注云+社区