[计算机视觉] 入门学习资料

本文将介绍计算机视觉相关的经典书籍,顶级期刊/会议,在线学习课程,常用开源库和安利小工具等。

简介

计算机视觉(Computer Vision)

计算机视觉是一个跨学科领域, 涉及如何使计算机能够获得从数字图像或视频的高层次理解。从工程学的角度来看, 它寻求自动化人类视觉系统可以做的任务。

Reference:https://en.wikipedia.org/wiki/Computer_vision

计算视觉相关条目

Outline of computer vision

Reference:https://en.wikipedia.org/wiki/Outline_of_computer_vision

Category:Computer vision

Reference:https://en.wikipedia.org/wiki/Category:Computer_vision

经典书籍

《Multiple View Geometry in Computer Vision》Second Edition

计算机视觉中的一个基本问题是了解真实世界场景的几个图像的结构。解决这个问题的技术来自投影几何和摄影测量。在这里,作者按照相机投影矩阵,基本矩阵和三焦张量来描述几何原理和它们的代数表示。这些实体的计算理论和方法都是用实例来讨论的,正如它们用于重建多个图像的场景一样。新版本的特点是对书中的关键概念进行了扩展介绍(本书已经更新了其他示例和附录)以及自第一版以来出现的重要新结果。提供了全面的背景材料,因此熟悉线性代数和基本数值方法的读者可以理解所提出的投影几何和估计算法,并直接从书中实现算法。

注:理解3D到2D变换的必备书籍,如homography推导

Reference:http://www.robots.ox.ac.uk/~vgg/hzbook/

《Computer Vision: Algorithms and Applications》

此书是计算机视觉的圣经,介绍CV诸多方向,内容很全,十分适合作为入门和进阶书籍。介绍的内容有特征检测、匹配,分割,SFM,图像拼接,立体视觉,三维重建等。

Reference:http://szeliski.org/Book/

《Computer Vision: Models, Learning, and Inference》

本书也是计算机视觉经典书籍,其以最小的先决条件为基础,从概率和模型拟合的基本知识入手,并提供可供读者实施和修改以构建有用视觉系统的实例。主要面向高级本科生和研究生,详细的方法论演示对计算机视觉从业者也很有用。 本书涵盖尖端技术,包括图形切割,机器学习和多视图几何的方法,显示重要计算机视觉问题的解决方案,例如相机校准,人脸识别和对象跟踪,描述了70多种算法。

Reference:http://www.computervisionmodels.com/

《An Invitation to 3d vision》

本书介绍了三维视觉的几何结构,即从一系列二维图像重建物体的三维模型。 它详细描述了两个视图几何的经典理论。

Reference:http://vision.ucla.edu/MASKS/

《Concise Computer Vision: An Introduction into Theory and Algorithms》

本书重点突出重要算法和数学概念的作用。

Reference:http://www.springer.com/us/book/9781447163190

《Robot Vision》

This book presents a coherent approach to the fast moving field of machine vision, using a consistent notation based on a detailed understanding of the image formation process.

Reference:https://mitpress.mit.edu/books/robot-vision

《Computer Vision: A Modern Approach》

《Learning OpenCV》

OpenCV1.x教材书,本书于2008年出版(有中文版),是OpenCV1.x最佳书籍,早期学习OpenCV的程序员必备书籍。

Reference:http://it-ebooks.info/book/299/

《Learning OpenCV3》

OpenCV3.x教程书,本书于2016年出版(目前还没有中文版),是OpenCV3.x最佳书籍,现在学习OpenCV的程序可选书籍。

Reference:http://shop.oreilly.com/product/0636920044765.do

《数字图像处理》冈萨雷斯

顶级CV期刊/会议

期刊

TPAMI:https://www.computer.org/web/tpami

IJCV:https://link.springer.com/journal/11263

会议

CVPR:http://cvpr2018.thecvf.com/

ICCV :http://iccv2017.thecvf.com/

ECCV :https://eccv2018.org/

SIGGRAPH :https://www.siggraph.org//

NIPS:https://nips.cc/

在线学习课程

Annotated Computer Vision Bibliography: Table of Contents:超全的计算机视觉知识网址,罗列近20年的知识(目前还在更新中)

Reference:http://www.visionbib.com/

CVonline:非常全面的资源链接

Reference:http://homepages.inf.ed.ac.uk/rbf/CVonline/

CS131: Computer Vision: Foundations and Applications

Reference:http://vision.stanford.edu/teaching/cs131_fall1718/

CS231n: Convolutional Neural Networks for Visual Recognition

非常好的教程,CV与DL结合,深入浅出!

Reference:http://cs231n.stanford.edu/CS231M: Mobile Computer Vision

CSE576: Computer Vision

Reference:http://courses.cs.washington.edu/courses/cse576/08sp/

Learn OpenCV

Reference:https://www.learnopencv.com/

常用开源库

OpenCV:计算机视觉库(支持C++/Python)

Reference:https://opencv.org/

EmguCV:主要支持.NET语言,如C#/VB/VC++

Reference:http://www.emgu.com/wiki/index.php/Main_Page

TensorFlow:TensorFlow™ 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。它灵活的架构让你可以在多种平台上展开计算,例如台式计算机中的一个或多个CPU(或GPU),服务器,移动设备等等。TensorFlow 最初由Google大脑小组(隶属于Google机器智能研究机构)的研究员和工程师们开发出来,用于机器学习和深度神经网络方面的研究,但这个系统的通用性使其也可广泛用于其他计算领域。

Reference:https://www.tensorflow.org/

Caffe:Caffe,全称Convolutional Architecture for Fast Feature Embedding。是一种常用的深度学习框架,在视频、图像处理方面应用较多。

Reference:http://caffe.berkeleyvision.org/

Caffe2:Caffe2 aims to provide an easy and straightforward way for you to experiment with deep learning and leverage community contributions of new models and algorithms. You can bring your creations to scale using the power of GPUs in the cloud or to the masses on mobile with Caffe2's cross-platform libraries.

Reference:https://caffe2.ai/

Pytorch:PyTorch是使用GPU和CPU优化的深度学习张量库。

Reference:http://pytorch.org/

Torch:Torch is a scientific computing framework with wide support for machine learning algorithms that puts GPUs first. It is easy to use and efficient, thanks to an easy and fast scripting language, LuaJIT, and an underlying C/CUDA implementation.

Reference:http://torch.ch/

MxNet:一个用于深度学习的灵活且高效的库

Reference:http://mxnet.incubator.apache.org/index.html

Theano:Theano是一个Python库, 它允许你有效地定义、优化和评估涉及多维数组的数学表达式。

Reference:http://deeplearning.net/software/theano/

Keras:Keras 是一种高层次的神经网络 API,它以 Python 编写,能够在 TensorFlow、CNTK 或 Theano上运行。

Reference:https://keras.io/

Dlib:Dlib 是一个c++工具包,包含机器学习算法和工具,用于在 c++中创建复杂的软件以解决现实世界中的问题。它在工业和学术界都有广泛的应用,包括机器人、嵌入式设备、移动电话和大型高性能计算环境。Dlib 的开源授权允许您在任何应用程序中免费使用它。

Reference:http://dlib.net/

安利小工具

Google Scholar:强大的论文搜索引擎

Reference:https://scholar.glgoo.org/

arXiv.org:最新的论文刊登平台

Reference:https://arxiv.org/list/cs.CV/recent

Library Genesis:很好用的搜索英文电子书的网站Library Genesis

Reference:http://gen.lib.rus.ec/

PAMITC:汇集WACV,CVPR和ICCV

Reference:http://www.pamitc.org/

awesome-computer-vision:github上关于CV方向超全面的资料库,涵盖常用书籍,课程,期刊/会议,软件,数据集和博客等。

Reference:https://github.com/jbhuang0604/awesome-computer-vision

原文发布于微信公众号 - CVer(CVerNews)

原文发表时间:2018-03-12

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

机器之心「GMIS 2017」嘉宾揭秘:LSTM之父Jürgen Schmidhuber

2017 全球机器智能峰会(GMIS 2017),让我们近距离接触「LSTM 之父」Jürgen Schmidhuber。 2017 全球机器智能峰会(GMIS...

3198
来自专栏新智元

【面试107问】谷歌等巨头机器学习面试题:从逻辑回归到智力测验

【新智元导读】很多人都想知道,谷歌、微软、Facebook 这样的顶级科技公司,在面试大数据机器学习工程师时会问些什么问题。可惜的是,这些公司的面试者事先都要签...

4427
来自专栏懒人开发

(3.8)James Stewart Calculus 5th Edition:Derivatives of Logarithmic Functions

具体 y = a^x 求导过程,可以见3.5.5: 先化简: (指数函数,只要求导,化成e为底去做, 因为e^x 求导,为 e^x ,这样可以简化难度)

893
来自专栏大数据挖掘DT机器学习

一份SPSS回归分析与数据预处理的心得体会

关于SPSS数据预处理 拿到一份数据,或者在看到国内外某个学者的文章有想法而自己手里的数据刚好符合这个想法可以做时,在整理好数据后不要急于建模。一定要对数据做...

6405
来自专栏机器学习算法与Python学习

tweet情感分析流程

关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第二 【Python】:排名第三 【算法】:排名第四 前言 自然语言处理(NLP)中一个很...

3728
来自专栏机器之心

前沿 | 首次大规模神经机器翻译架构分析结果出炉,LSTM 优于GRU

选自arxiv 作者:Denny Britz等 机器之心编译 参与:微胖、蒋思源、吴攀 这样的实验只有谷歌级别的公司才能处理的了。这篇文章对大型 NMT 模型训...

45510
来自专栏AI科技大本营的专栏

AI 技术讲座精选:数学不好,也可以学习人工智能(四)——图解张量

【AI100 导读】本文是《数学不好,也可以学习人工智能》系列的第四篇文章,主要内容围绕 Tensors(张量)展开。 ? 现在的你是否已经下载好 Tensor...

4896
来自专栏AI科技评论

深度 | 清华大学博士生涂锋斌:设计神经网络硬件架构时,我们在思考些什么?(上)

基于神经网络的人工智能近年取得了突破性进展,正在深刻改变人类的生产和生活方式,是世界各国争相发展的战略制高点。 神经网络作为实现人工智能任务的有效算法之一,已经...

3306
来自专栏深度学习自然语言处理

大数定律和中心极限定理的区别和联系

昨天看了中心极限定理,今天写本科论文期间,又抽业余时间看了看大数定律,刚开始差点把本小博主给看蒙了O.O,对就是这样。后来去了知乎上瞅了瞅,还是瞬间懂了。知乎上...

1421
来自专栏前沿技墅

揭开计算机识别人类语言的神秘面纱——词向量

1313

扫码关注云+社区

领取腾讯云代金券