现代计算机视觉领域的先驱是1963年Larry发表的名为方块世界的论文。里面提到我们大脑对视觉信息的处理是基于边缘和形状的,而Lary试图从图像中解析出这些边缘和形状。
在1966年,MIT人工智能实验室成立了,MIT里面的教授开始着手解决计算机视觉的问题。在此之后,计算机视觉成为人工智能增长最快的一个研究领域。
他写了<<视觉>>一书,他给了我们非常重要的领悟,即视觉是分层的,它与Hube提出的“视觉处理过程从一些简单的形状开始”共同构成了现代深度学习架构的基石。David Marr将图像分为几层:
斯坦福大学提出了'generalized Cylinder'模型:整个世界由简单的形状组成,任何东西都由这些简单的形状组成,然后再不同的角度下观察得到的。
2006年富士康据此开发出第一款实时面部检测的数码相机