前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >如何学习计算OpenCV

如何学习计算OpenCV

作者头像
OpenCV学堂
发布2018-04-13 15:06:32
1.6K0
发布2018-04-13 15:06:32
举报

如何学习OpenCV

一:学习OpenCV三个阶段

人工智能带火了计算机视觉的人才需求,作为计算机视觉应用开发框架OpenCV也越来越受到欢迎,市场需求大增,很多人听说了之后就迫不及待的想加入这波大军,这其中很多人他可能懂应用编程,但是计算机视觉零基础,一般都是我要识别个什么,而且还有时间限制,一般都是一个月左右时间,急功近利的心态可见一斑,学了几个API之后看到了点效果就觉得OpenCV也没什么嘛,感觉跟我搞应用开发一样啊,很快上手啦,就在这个时候发现应用场景稍微有点改变,之前那一点点的效果也没有了,什么都识别不了,然后又发现还有这么多东西要学,才发现这个算法没听说过、那个算法不知道,甚至连他自己调用的算法API那些参数是什么意思也没搞懂怎么调,于是他们就会抱怨OpenCV做的也太差了,压根不行啊,才发现做计算机视觉好难,其实是他们学习OpenCV的打开方式不对。正确的打开方式应该是这样:首先学习基础,如何知道自己的图像处理与计算机视觉的基础如何呢,很简单如果你能正确回答下面的十个问题,那说明你还是有点图像处理基础的。

1.图像常见的格式有

A.jpg B.tiff, C.png, D.webp

2.常见的图像通道数可能是:

A. 单通道 B.双通道 C. 三通道 D.四通道

3.数字图像中最小数据单元是什么

A. 像素 B.亚像素 C.超像素 D.颜色

4.常说的图像滤波是什么数学原理

A. 傅立叶变换, B.离散余弦变换 C.卷积 D.距离变换

5.常见的图像插值算法有

A. 最近邻 B. 双立方 C. lanczos插值 D.双线性

6.常见的RGB图像每个像素点颜色值范围

A. 0~1 B. 0~256 C.0~255 D.0~180

7.关于RGB色彩的描述下面正确的是:

A.RGB(255,255,255)表示黑色 B.RGB(0,0,255)表示蓝色 C.RGB(255,0,0)表示绿色 D.RGB(0,0,0)表示白色

8.常见的图像色彩空间有:

A. HSL B. HSV C. RGB D. YCrCb

9.常见的图形绘制时候像素渲染方法有

A.四邻域渲染 B.八邻域渲染 C.透明通道混合反锯齿渲染 D.游戏渲染

10.下面关于RGB图像亮度与对比度说法正确的是

A.颜色值越高,亮度越高 B.降低图像亮度会影响图像对比度 C.亮度就是图像对比度 D.图像对比度就是图像直方图

上面10道题是图像处理基础知识考察,其考察目的是检验是否拥有学习OpenCV一些必备的基础知识,如果你一半都没有做对(关注公众号,发送 【答案】两个字,即可查看答案),我觉得暂时你应该先放下你的那些识别、检测的目标,而是老老实实的看视频课程或者图书、博客文章等,厘清这些基本概念,本人根据自己学习图像处理、计算机视觉与OpenCV亲身经历,总结一个学习路线图,仅供大家参考:

大致分为三个阶段,第一个阶段应该是基础,第二个阶段是提升、第三个阶段是应用,而很多初学者一般都看重的是第三部分,素不知前面还有N多东西没学,正所谓“千里之行,始于足下”。只有走好学习OpenCV的第一步我们才能走好剩下的999步。否则就会出现“欲速则不达”的尴尬局面,貌似懂,一做应用什么都不行,调用哪个OpenCV算法函数都无法解决问题的进退维谷之中。

二:做内外兼修的OpenCV开发者

OpenCV3.x中集成了超过1000个算法模块,这些算法如何组合使用,他们的参数意义,算法的原理与适用场景条件等各不相同,要成为一个真正的OpenCV开发高手,必须精通常见的算法原理,各个参数意义,参数使用等,就拿我们最常见的OpenCV中HAAR人脸检测来说吧,整个代码演示我可以做到20行以内实现,但是具体到应用场景,我就听到有人跟我说HAAR级联人脸检测速度太慢了这样的抱怨,原因是他连最基本的各个参数是什么意思都没搞清楚,更谈不上调参数优化啦HAAR级联检测器API调用如下:

代码语言:javascript
复制
void cv::CascadeClassifier::detectMultiScale
(    
    InputArray  image,
    std::vector< Rect > &   objects,
    double  scaleFactor = 1.1,
    int     minNeighbors = 3,
    int     flags = 0,
    Size    minSize = Size(),
    Size    maxSize = Size() 
)

第一个参数image是输入图像 第二个参数objects检测到的人脸BOX位置信息 第三个参数是放缩比率,这个参数是用来构建HAAR多尺度用的, 第四个参数是计算人脸BOX的最小相邻个数 第五个参数是标志,在OpenCV3.0以后的版本中已经不再使用,没有任意意义 第六个参数是检测人脸时,可以检出BOX的最小宽高 第七个参数是检测人脸时,可以检出BOX的最大宽高 上述的七个参数,对检测速度与检测结果影响比较大的分别是第三、第四、第六、第七个参数,第六与第七个参数是设置大小,这个很容易理解,比较难理解的是第四个,最小相邻个数,假设最小相邻数目取3、则有下图:

表示在最终红色BOX人脸检测结果是基于HAAR级联检测砖红色、青色、蓝色框的求得平均值得到红色BOX框,理论上3表示至少有三个候选,这个参数值越大,检测结果输出人脸的准确率越高,同样耗时也会越长、还会导致漏检率增加。而很多初学者没有仔细了解该参数的意义,更无从谈起如何优化参数,另外三个参数,如果考虑速度的话,最好设置最大与最小可检测人脸BOX范围,这里有利于减少计算时间,提升实时性能。这里只是通过这个例子来说明OpenCV中的各个算法API参数重要性,要成为OpenCV开发高手,个人认为要做到内外兼修,这里内是指相关数学、算法论文都认真读、仔细的研究,不断加深对相关算法的理解与领悟;外是指要加强动手能力,编程能力,做为OpenCV开发者我们首要职责就是负责让视觉相关应用落地,没有很强悍的工程能力与解决问题能力很难做到这点。结合本人的亲身实践和学习路径,建议在学习OpenCV 编程时搞清楚几点对学习更加有帮助

1.学习API函数时查找相关论文,尝试阅读论文

2.搞清楚学到的每个算法相关数学基础,尝试理解相关参数意义

3.学会看OpenCV官方的文档与代码示例

4.古语云“独学而无有、孤陋则寡闻”,所以多认识一些OpenCV学习者与开发者

5.从最新版本开始学习,OpenCV已经发布了OpenCV3.4.1最新版本,建议学习从OpenCV3.4开始学习,避免学习一些过期的API给自己带来不必要的烦恼与负担。

6.C++还是Python,当前OpenCV SDK支持C++与Python SDK,所以无论选择哪一种语言都可以学习OpenCV。

三:关注业界动态、紧跟技术潮流

如果你成功了经历了前面几个阶段,应该恭喜你是一个真正的OpenCV开发者啦,但是这个时候还有清醒的意识到你只是一个知道和熟悉常见OpenCV中算法、使用它们解决实际问题的开发者而已,要学会关注业界动态,关注OpenCV框架的新发展与新动向、特别是新算法在OpenCV框架中的实现与SDK发布,举例来说DNN模块发布已经快一年了,本人一直跟踪OpenCV的每个Release、深刻感受到它的功能越来越完善与强大,个人观点以后OpenCV的大部分对象检测与识别都可能基于DNN模块实现,这样的好处是对开发者显而易见,即降低了学习门槛,有提高了检测准确性与精度,对于DNN这样的新模块,作为OpenCV开发者的你是否一直在不断跟踪它,另外注意学术界的动态,OpenCV社区会很快把一些最新CVPR上面的论文变成想法算法模块的,所以对一些影响比较大的CVPR的论文有条件要及时跟进阅读与理解。

很多人想学习人工智能相关的热门技术,我觉得OpenCV就是很接地气,也很好的方向选择,也不需要太过深奥的数学知识,即使零基础也可以学会、学好。正如古人所说“假舆马者,非利足也,而致千里;假舟楫者,非能水也,而绝江河。君子生非异也,善假于物也”,借助OpenCV这个神兵利器,开发者也会从检测到识别无所不能。

后记:

也许不适合所有人,但是如果能对初学者有一点帮助,也算值得我写下上面几百字的肺腑之言了!

千里之行、始于足下。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-04-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 OpenCV学堂 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 如何学习OpenCV
    • 一:学习OpenCV三个阶段
      • 二:做内外兼修的OpenCV开发者
        • 三:关注业界动态、紧跟技术潮流
        相关产品与服务
        人脸识别
        腾讯云神图·人脸识别(Face Recognition)基于腾讯优图强大的面部分析技术,提供包括人脸检测与分析、比对、搜索、验证、五官定位、活体检测等多种功能,为开发者和企业提供高性能高可用的人脸识别服务。 可应用于在线娱乐、在线身份认证等多种应用场景,充分满足各行业客户的人脸属性识别及用户身份确认等需求。
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档