本文是一位朋友的投稿,他花了很大精力来实现了一个滴滴客户端的完整功能,非常具有学习的价值,推荐给大家~
int fourcc, // 编码形式,使用 CV_FOURCC()宏
昨天公众号中收到多学多看多体会多感悟的留言问在Android OpenCV里是否能能调用稠密光流,由于我也没有试过,所以我们就专门来做了一次这个操作,也感谢留言的小伙伴提出的问题,我们也是在不断地解决问题中学习成长的。
在JavaCV中,Mat 对象是一个非常重要的类,用于表示和操作图像、矩阵和多维数据。以下是关于JavaCV中的Mat对象的一些重要信息:
虽然视频文件是由多张图片组成的,但是imread()函数并不能直接读取视频文件,需要由专门的视频读取函数进行视频读取,并将每一帧图像保存到Mat类矩阵中,代码清单2-27中给出了VideoCapture类在读取视频文件时的构造方式。
关于OpenCV像素操作,我们在VS2017里面新建项目pixeldemo,然后导入配置好属性环境(配置属性环境看VS2017配置Opencv通用属性文章)
想做的是这么一个东西:识别视频(或者摄像头获得的实时视频)中的人脸,并判断是谁(因为数据采集的原因,找了身边的5个朋友采集了一些数据),如果不是这几个人,标记为其他人。 功能上其实比较简单,主要是想体会一下这整个过程,做下来还是有很多值得注意的地方的。大致框架也比较简单:
《OpenCV源码Android端编译,用时三天,我编了个寂寞。。。》文中介绍了编译OpenCV+Contrib模块的编译,虽然Andorid下编译始终没有获得libopencv_java4.so的库,不过在Windows下编译还是正常的,今天主要介绍人脸特征点的检测功能,就用到Contrib模块中的FaceMarkLBF。
泊松融合我自己写的第一版程序大概是2016年在某个小房间里折腾出来的,当时是用的迭代的方式,记得似乎效果不怎么样,没有达到论文的效果。前段时间又有网友问我有没有这方面的程序,我说Opencv已经有了,可以直接使用,他说opencv的框架太大,不想为了一个功能的需求而背上这么一座大山,看能否做个脱离那个环境的算法出来,当时,觉得工作量挺大,就没有去折腾,最近年底了,项目渐渐少了一点,公司上面又在搞办公室政治,我地位不高,没有参与权,所以乐的闲,就抽空把这个算法从opencv里给剥离开来,做到了完全不依赖其他库实现泊松融合乐,前前后后也折腾进半个月,这里还是做个开发记录和分享。
昨天在GitHub上看到了一个开源的项目,是利用深度学习来检测是否有佩戴口罩的,感觉还挺好玩的,于是就去下载了训练好的模型,打算用OpenCV的dnn模块来跑一跑。然而,在经过前向传播后,得到的推理矩阵prob是一个1x5972x2 的Mat矩阵,和之前遇到过的推理结果都不太一样,在经过多种解码方式的尝试后,还是没能够对这个推理结果正确得解码。并且在网上搜索也没有找到相关的内容,几乎没有网友使用OpenCV来运行这个模型,基本都是使用深度学习的框架来运行。这就很无奈了,现在只能暂时把这个模型放一边,等其他时候再来研究一下该怎么对它的推理结果进行解码。
在科技未达到如此高的境界时,我们应该先关注一下身边的人工智能:Android端身份证识别。为什么我会提到这个名词呢?随着移动终端(智能手机及平板电脑)的普及,几乎人人都有一部手机已经毋庸置疑了。进而也引发了移动应用爆发似的浪潮,各类APP应接不暇:金融类的、办公类的、电商类的等等。这些应用大多会涉及到身份证的实名认证。如果让用户手动输入信息,显然不符合时代背景,必然会流失一大批“粉丝”。
imread的函数原型是:Mat imread( const string& filename, int flags=1 );
OpenCV中Mat类是一个是一个用来存放视图像数据的结构,其中的数据可能是连续存储的,也可能是不连续存储的。
经过几个月的努力,小白终于完成了市面上第一本OpenCV 4入门书籍《从零学习OpenCV 4》。为了更让小伙伴更早的了解最新版的OpenCV 4,小白与出版社沟通,提前在公众号上连载部分内容,请持续关注小白。
数据集下载在百度云盘:链接:https://pan.baidu.com/s/1-kYEZtOo99VJGHrKlOK5dQ 提取码:jgx7
最近一系列的文章都是用Android利用OpenCV NDK的方法通过摄像头实时获取图像进行图像处理,在上一篇《Android使用Tesseract-ocr进行文字识别》我们学习了一下TesserartOCR的图像识别功能,这一章主要介绍怎么样通过图像的处理再加上我们OCR的识别获取的想要的东西。
因为c++算法还不会,决定先用matlab试试,找到一个imfill可以实现区域的填充
老师让我评价一下别人的一个跟踪效果,只有带跟踪框的视频,所以需要检测这个框,用了下投影,最早用matlab写的一个脚本,很简单,转到opencv里反而有些麻烦,老不用忘得很厉害,昨天搞了2个小时可以运行了,中间用到图像像素和通道的操作,顺便做个总结: 灰度图像,加的红色框,我想做的是检测到这个红色框的四个顶点的位置,比如下面这个图:
下图形象地展示了一张图像中的各个像素点数据是如何存储的, 因为图像本身的像素点比较多,下图显示的图像像素数据只是图片左上角20×20大小的部分数据:
OpenCV 3.0以及以后版本集成了HDR算法,样例代码的路径为: .\sources\samples\cpp\tutorial_code\photo\hdr_imaging.cpp。 实现算法的参考文献为《Recovering high-dynamic range radiance maps from photographs》,作者主页:http://www.pauldebevec.com/Research/HDR/。 作者主页上有实验的测试图片序列,可以下载下来,配合样例代码使用。OpenCV官方文档
numpy.random.normal(loc=0,scale=1e-2,size=shape)
这里的需求是,判断摄像头有没有被物体遮挡。这里只考虑用手遮挡—- 判断黑色颜色的范围。
上一篇《Android利用SurfaceView显示Camera图像爬坑记(五) -- 在现有项目中加入NDK配置》中我们已经把NDK加入到SurfaceView实时图像显示了,这一篇我们就针对这个实时进行图像处理,并显示到预览实时帧中。
在matlab里.m文件分执行文件和函数文件 在c++中执行文件指:main函数 函数文件:其他所有需要用到的函数
过几个月的努力,小白终于完成了市面上第一本OpenCV 4入门书籍《从零学习OpenCV 4》。为了更让小伙伴更早的了解最新版的OpenCV 4,小白与出版社沟通,提前在公众号上连载部分内容,请持续关注小白。
以上章节采免安装方式,所以安装章节可以直接跳过,节约点时间用springboot整合OpenCV(也可以用maven项目或者简单的java项目),主要是引入一个jar包和库文件,jar跨平台,库文件不跨平台,所以要区分windows和linux,至于工具idea就ok. 环境安装可以参考:springboot免安装整合Opencv兼容windows和linux
mat文件是matlab专用的文件,第一次见是再COCOstuff-10k数据集中。
对于给定的数独照片(尽可能干净整齐),进行一系列处理,提取位置和数字信息,这中间可能要用到一系列图像处理的基本算法,数字识别时初步打算用knn来做,knn对手写体的精度一般,这里要求输入应该是打印体,这样才能保证正确率,最后通过数独求解的算法算出答案。
翻译:陈之炎 校对:吴振东 本文约2400字,建议阅读5分钟本文为大家系统地介绍了OpenCV对图像的操作。 图像的输入/输出 从文件中加载图像: 如果读入的是一个JPG文件,默认状态下会创建一个3通道图像。如果你需要将其制成灰度图像,则使用以下代码: 注 文件格式由其内容(前几个字节)确定。将图像保存为一个文件: 注 文件的格式由其扩展名确定。 用CV :: imdecode和CV :: imencode从内存中读取和写入图像。 基本的图像操作 访问像素亮度值 为了获取像素亮度值,首先必须知道图像的
使用OpenCV进行人脸检测我写过两篇文章《C++ OpenCV之级联分类器--人脸检测》和《Android NDK OpenCV级联方式实时进行人脸检测》,不过这两篇里面用到的检测方式都是HAAR级联检测器,现在OpenCV4里面官方支持的人脸检测方法也已经是基于深度学习的方法进行检测了,所以我们这篇主要就是看OpenCV下用DNN进行人脸检测。
说起神经网络,很多人以为只有Keras或者tensorflow才支持,其实OpenCV也支持神经网络的,下面就使用OpenCV的神经网络进行手写数字识别,训练10次的准确率就高达96%。 环境准备: vs2015 OpenCV4.5.0 以下为ANN神经网络的训练代码:
最近这几篇OpenCV相关的文章都是与人脸有关,其实最主要是就是想做人脸替换的小试验,大概流程是:
前后端的耦合想了很久,上下课都在思考怎么做,然后终于憋出来了。这是之前搞的一个视觉计算的项目,boss叫对接到前端,于是就产生了这样一个诡异的需求,就是前端打开摄像头,同时需要把摄像头的数据回传到后端进行图像处理(比如美颜啊脑袋上加个装饰品之类),这就需要涉及到前端和服务端的数据编码耦合,想了想既然任何图像在内存里面都是一个uchar矩阵,于是琢磨了这个东西出来。
其中,左侧是Robert算子的X方向梯度、右侧是Y方向梯度。 自定义Robert算子实现如下:
从真实世界中获取数字图像有很多方法,比如数码相机、扫描仪、CT或者磁共振成像。无论哪种方法,我们(人类)看到的是图像,而让数字设备来“看“的时候,都是在记录图像中的每一个点的数值。
在使用OpenCV进行图像处理或计算机视觉任务时,你可能会遇到类似以下错误的错误信息:
学习OpenCV大家都会遇到一个对象叫做Mat,此对象非常神奇,支持各种操作。很多初学者因此被搞得头晕脑胀,它各种用法太多台杂,搞得初学者应接不暇,感觉有心无力、无处下手之感这里我们首先要正本清源,从Mat对象的产生原因说起,然后再把Mat各种神奇用法一一梳理总结。 Mat对象起源: 当OpenCV 1.0发布时候没有Mat对象,是个C语言风格的数据结构IPlImage来表示内存中图像对象,但是OpenCV开发者在做复杂图像处理算法分析与计算时候,创建了很多IplImage这样的数据结构,偶尔最后可能忘记释
我在上两篇文章「手把手教你编写傅里叶动画」、「傅里叶动画专辑欣赏」中介绍了傅里叶级数的本质以及编写了一些有趣的傅里叶动画,主要讲述了周期性函数究竟是如何一步步被分解成正余弦函数的和的。但是,不幸的是我们在工程中使用的一些函数往往会有一些非周期性函数,那么我们该如何用三角函数来描述它们呢,这就是今天我要讲述的傅里叶变换。
本文作者使用C++编写一套基于OpenCV的YOLO目标检测,包含了经典的YOLOv3,YOLOv4,Yolo-Fastest和YOLObile这4种YOLO目标检测的实现。附代码详解。 >>加入极市CV技术交流群,走在计算机视觉的最前沿
俗话说:不基于需求的敲代码都是耍流氓 ---- 一、人脸检测: 1.准备材料 首先需要准备人脸的训练数据,这个在官方的Github可以下载到,这里用:lbpcascade_frontalface.x
深度学习推理框架 OpenPPL 已经开源了,本文以一个图像分类实例,从 0 到 1 讲解如何部署一个深度学习模型,完成一个 AI 推理应用。
一、理论准备 1.1、图像分割 图像分割是图像处理中的一种方法,图像分割是指将一幅图像分解成若干互不相交区域的集合,其实质可以看成是一种像素的聚类过程。通常使用到的图像分割的方法可以分为: 基于边缘的技术 基于区域的技术 基于聚类算法的图像分割属于基于区域的技术。 1.2、K-Means算法 K-Means算法是基于距离相似性的聚类算法,通过比较样本之间的相似性,将形式的样本划分到同一个类别中,K-Means算法的基本过程为: 初始化常数 ,随机初始化k个聚类中心 重复计算以下过程,直到聚类中心不再改变
最近也是在接触机器学习,通过做了几个MLNET的例子对机器学习有了一点了解,OpenCV中也有机器学习这块,所以我们就直接来用Kindle做一个实战。
==如果有报无法找到opencv_world343.dll的Error,请把C:\opencv\build\x64\vc14\bin下的opencv_world343.dll文件复制到C:\Windows 目录下即可==
中秋佳节即将来临,作为传统的中国节日之一,人们除了品尝美味的月饼、赏月外,还喜欢通过绘画来表达对这个节日的喜悦和祝福。而如今,随着科技的不断发展,竟然可以借助计算机视觉库OpenCV来绘制精美的月饼和可爱的玉兔图像,真是令人大开眼界。
kmeans算法主要用来实现自动聚类,是一种非监督的机器学习算法,使用非常广泛。在opencv3.0中提供了这样一个函数,直接调用就能实现自动聚类,非常方便。
由于篇幅原因,后面一篇写各个算法背后的原理,原理背后的相关知识的了解,人脸识别项目总遇到的问题
盲水印,顾名思义就是看不见的水印。今天我们来说下频域加盲水印。相信大家做过图像处理的对频域、时域、空间域概念都有了一定的了解。
我们在用OpenCV自带的摄像头JavaCameraView时,开启后手机竖屏会是旋转90度的效果,非常不友好,下面的代码即可实现我们用JavaCameraView根据手机横竖屏来获取到对应的图像.
领取专属 10元无门槛券
手把手带您无忧上云