(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)
OpenCV是计算机视觉开源工具中妇孺皆知的,但Dlib绝对是这几年快速上升的一颗新星,它并不追求大而全,但它实现的每一个模块和特性,都几乎是高质量开源算法的典范。
在刚刚结束的PyImageConf2018会议上,大名鼎鼎的Dlib库的创建者Davis King做了一个关于目标检测的报告,并举办了关于Dlib的含有40个新的开源Demo的各种计算机视觉与机器学习技术演示的WorkShop。展示了Dlib的强大锐利,是学习Dlib使用的绝佳资料,作者已将相关PPT、代码、数据开源,非常值得推荐!
Davis King本尊一直供职于工业界,热衷开源技术分享,最近今年尤其关注于计算机视觉与深度学习工具的构建,Dlib库中无论是其传统的HOG+SVM目标检测、高精度超快速广泛使用的人脸对齐,还是基于CNN的目标检测与人脸验证,Dlib每一次新特性和Demo的添加,几乎都是将学术界state-of-the-art技术实用化,令人印象深刻!
这次题为《Finding things in images How does that work? 》的目标检测报告,作者从滑动窗口讲到HOG检测器及其优化,并介绍了Dlib中基于图像金字塔的CNN目标检测,其速度很快且相比于SSD算法其对小目标检测性能更好,并分享了影响目标检测性能的一些因素,比如训练数据数量和质量及超参数的优化等,详细内容可在文末下载PPT查看。
在关于Dlib使用的WorkShop中,Davis King通过40个新的Python例子代码展示了Dlib解决目标检测问题从数据标注到训练模型到参数优化的方方面面,你会发现原来Python-Dlib这么简单(是的,有些功能只需要几行代码!),作者同时展示了Dlib中其他一些有趣功能和实践示例,每份代码都值得细读并在你的机器上跑一遍。
下面是这40个例子的主要功能:
001——训练HOG检测器;
002——运行HOG检测器;
003——为人脸特征点检测制作人脸图像数据和XML文件;
004——训练人脸特征点检测模型;
005——运行人脸特征点检测模型;
006——匈牙利算法;
007——8像素步长的HOG检测;
008——制作包围盒回归训练数据集;
009——训练目标检测中包围盒回归模型;
010——检测人脸并进行精确的包围盒回归定位;
011——全局最优化方法(这是Davis King强烈安利的新特性!);
012——训练包围盒回归模型并进行超参数搜索;
013——在视频中检测人脸并进行包围盒回归位置提精和卡尔曼滤波;
014——可分离滤波器;
015——训练nuclear norm的HOG检测器;
016——运行nuclear norm的HOG检测器;
017——训练多个HOG检测器;
018——运行多个HOG检测器;
019——训练多个HOG检测器并进行超参数优化;
020——图像哈希;
021-023——使用联通域分析进行斑点检测,并进行速度优化;
024——边缘检测并找直线;
025-026——通过梯度计算亮斑;
027——霍夫变换;
028-034——通过霍夫变换定位图像中的纸张;
035——通过mbd方法定位视频中旋转的指尖陀螺;
036——通过MSER进行文本检测;
037——训练RBF核的SVM的二类问题,自动优化最优参数(Dlib中的AutoML);
038——求和运算的缓存SIMD优化;
039——多线程数据加载;
040——使用CUDA进行矩阵运算加速。
Github地址:
https://github.com/davisking/pyimageconf2018