GitHub上有哪些比较好的计算机视觉/机器视觉的项目？

kbsc13

发布于 2019-10-10 11:08:33

2.1K0

发布于 2019-10-10 11:08:33

文章被收录于专栏：AI 算法笔记AI 算法笔记

来源：Unsplash，作者： JR Korpa

来源：知乎问题链接：https://www.zhihu.com/question/30049772 编辑：算法猿的成长，仅用于学习分享，如有侵权，会立刻删文。

今天分享一下 Github 上不错的计算机视觉或者机器视觉方面的项目，包括入门的教程、非常经典的算法和实战项目等等。

计算机视觉联盟

https://www.zhihu.com/question/30049772/answer/831391266

从个人经历出发，全部都是自己在成长过程中所收集到的干货项目，很多都是自己经过筛选自己总结的，保证你能获取的是干货，拿走不谢！本王只需您的点赞和关注！

【1】机器学习西瓜书手推笔记（PDF可打印版本）

自己的纯手推笔记，附PDF可打印版本

https://github.com/Sophia-11/Machine-Learning-Notes

【2】计算机视觉领域资源汇总

汇集了计算机视觉资源汇总，包含计算机视觉方向算法汇总、论文汇总

https://github.com/Sophia-11/Awesome-CV-Resources

【3】计算机视觉顶会ICCV2019论文集（标星90）

持续更新收集所有ICCV2019论文集，做科研，搞算法，跟踪最前沿论文思路，少不了这些顶会论文，附下载链接

https://github.com/Sophia-11/Awesome-ICCV2019

【4】再几个目标检测经典算法链接：

YOLO darknet版本：

https://pjreddie.com/darknet/yolo/

YOLO Keras版本：

https://github.com/qqwweee/keras-yolo3

YOLO mobilenet：

caffe Linux 和Windows 版本：

https://github.com/eric612/MobileNet-YOLO

https://github.com/eric612/Caffe-YOLOv3-Windows

Keras版本：

https://github.com/Adamdad/keras-YOLOv3-mobilenet

MXNET版本：

https://gluon-cv.mxnet.io/model_zoo/detection.html#yolo-v3

https://github.com/sufeidechabei/gluon-mobilenet-yolov3

机器学习西瓜书手推笔记（PDF可打印版本）

Table of Contents

第一章绪论第二章模型评估与选择第三章线性模型第四章决策树第五章神经网络第六章支持向量机第七章贝叶斯分类器第八章集成信息第九章聚类第十章降维与度量学习第十一章特征选择与稀疏学习第十二章计算学习理论第十三章半监督学习第十四章概率图模型第十五章规则学习第十六章强化学习

第一章绪论

高清图见GitHub链接：https://github.com/Sophia-11/Machine-Learning-Notes

第二章模型评估与选择

计算机视觉领域资源汇总

Table of Contents

全球高校计算机视觉实验室名单

计算机视觉算法资源汇总

AI顶会（2019~2020）

写了这么多的，希望得到您的关注和点赞，如果想获取更多，可以查看GitHub或关注公众号【计算机视觉联盟】！

量子位的回答

https://www.zhihu.com/question/30049772/answer/741863783

谷歌大脑Quoc Le团队，又训练出了一只地表最强的模型。

那是一个目标检测模型，从前并不是最强大。

但自从用机器学习解锁了特别的数据扩增策略，再用自动扩增来的新数据集训练目标检测模型，事情就完全不同了。

注意：目标检测和分类不一样，分类不需要标注边界框，而目标检测需要。

△ 左边是自动扩增数据，右边是成绩提升

模型在COCO目标检测任务上，拿到了50.7 mAP的最高分，刷新从前的纪录。

谷歌的方法，并没有改变模型本身，但有效提升了准确率，+2.3 mAP以上。

团队还强调，AI在COCO数据集里学到的扩增策略，直接迁移到其他数据集上，同样可以提升准确率。

现在，算法已经开源了，AI学到的扩增策略也在里面。

是怎样的扩增策略？

论文写到，这里的数据扩增只涉及了一些简单变换 (Simple Transformations) ：

有应用在整张图片上、但不会影响边界框的那种变换，比如从图像分类里借来的颜色变换 (Color Transformations)。也有不影响整张图片、但改变边界框位置的那种变换，比如图像平移 (Translating) 或剪切 (Shearing) 。还有只针对边界框里的目标，而进行的变换。

注意，这些变换只用在训练过程中，不会用到测试环节里。

研究人员说，当变换的数量越来越庞大的时候，就很难手动把它们有效组合到一起了。

所以，就要用机器学习，搜索出更适合目标检测任务的组合策略。

思路是这样的：

团队把数据扩增搜索 (Data Augmentation Search) 看做一个离散的优化问题，优化的是模型的泛化表现。

在自家的另一篇论文 (arXiv:1805.09501) 基础上，把重点转移到针对目标检测的扩增策略上。

比起图像分类任务的数据扩增，目标检测的难点在于，要保持边界框和发生形变的图像之间的一致性(Consistency) 。

而边界框的标注，也为数据扩增提供了一种新的方式：只在边界框里面修改图像。就像上文讲的那样。

另外，团队还探索了在图片发生几何变换 (Geometric Transformations) 的情况下，怎样去改变边界框的位置。

具体方法是这样的：

把扩增策略定义成一组无序的子策略 (Sub-Policy) 。

在训练过程中，每个子策略都会被随机选中，应用到当前的图片里去。

每个子策略里，有N个图片变换，依次在同一张图上进行。

要把这个搜索过程，变成一个离散的优化问题，就要创建一个搜索空间。

空间里面，有5个种策略，每种子策略有2种图像变换运算。

另外，每个运算还和两个超参数相关联，一个是代表应用这个运算的可能性 (Probability) ，二是这个运算的大小 (Magnitude) 。

初步实验之后，团队定下了22种图像变换运算。

学习完成的子策略，成效是这样的：

肉眼可见，成效显著。

一是在COCO目标检测中，以50.7 mAP拔得头筹，(比策略训练前) 提升了2.3 mAP。

二是在PASCAL VOC目标检测中，提升了2.7 mAP。

也就是说，在COCO上训练好的策略，直接搬到其他数据集上也有效。

团队说，这个方法尤其适合在小数据集中避免过拟合。

代码开源了，你也去试一下吧。

论文传送门：

https://arxiv.org/abs/1906.11172

代码传送门：

https://github.com/tensorflow/tpu/tree/master/models/official/detection

— 完 — 量子位 · QbitAI վ'ᴗ' ի 追踪AI技术和产品新动态

量子位欢迎大家关注我们，以及订阅我们的知乎专栏

「已注销」

https://www.zhihu.com/question/30049772/answer/127460083

非常多啊

先说说较大的框架项目：

**OpenCV **https://github.com/opencv/opencv
dlib https://github.com/davisking/dlib
Caffe https://github.com/BVLC/caffe
Mxnet https://github.com/dmlc/mxnet
tensorflowhttps://github.com/search%3Futf8%3D%25E2%259C%2593%26q%3Dtensorflow

视觉这块最主要的检测以及追踪

检测：

RCNN，Fast-RCNN，Faster-RCNN 现在最主流的检测框架，https://github.com/rbgirshick/py-faster-rcnn -- see https://github.com/ShaoqingRen/faster_rcnn for the official MATLAB version
SSD，达到实时的检测算法，https://github.com/weiliu89/caffe/tree/ssd
DPM，早期的检测算法，使用latent SVM GitHub - https://github.com/rbgirshick/voc-dpm.

追踪：

TLD，非常鲁棒的跟踪算法 https://github.com/zk00006/OpenTLD

孔涛

https://www.zhihu.com/question/30049772/answer/107232336

我来回答几个，以下的几个代码我都实际运行过，有一部分仔细读过。

pdollar (Piotr Dollar) https://github.com/pdollar

Piotr's Computer Vision Matlab Toolbox，里边包含各种各样的算法，包括特征提取、分割、分类稍等等。 Structured Edge Detection Toolbox，检测中的edgebox算法 MSCOCO API

DL系列

Caffe: https://github.com/BVLC/caffe: a fast open framework for deep learning.
model zoo: https://github.com/BVLC/caffe/wiki/Model-Zoo，这个里边包含了基于caffe实现的各种各样的模型。其实像Tensorflow、MatConvNet这些每一个都是很好的项目

voc-dpm https://github.com/rbgirshick/voc-dpm: Object detection system using deformable part models (DPMs) and latent SVM (voc-release5). You may want to use the latest tarball on my website. The github code may include code changes that have not been tested as thoroughly and will not necessarily reproduce the results on the website.
铅笔画的自动生成，把一副图像变成铅笔水粉画，感觉很酷很酷炫有木有 https://github.com/candycat1992/PencilDrawing

匿名用户

https://www.zhihu.com/question/30049772/answer/47066644

https://github.com/jbhuang0604/awesome-computer-vision

来自 https://github.com/bayandin/awesome-awesomeness ，各种领域的 Awesome。

本文参与腾讯云自媒体分享计划，分享自微信公众号。

原始发表：2019-10-08，如有侵权请联系 cloudcommunity@tencent.com 删除

https

本文分享自算法猿的成长微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体分享计划，欢迎热爱写作的你一起参与！

登录后参与评论

0 条评论

热度