首页
学习
活动
专区
工具
TVP
发布

贾志刚-OpenCV学堂

三本书《Java数字图像处理-编程技巧与应用实践》、《OpenCV Android开发实战》、《OpenCV4应用开发-入门、进阶与工程化实践》作者。OpenCV实验大师平台 软件作者
专栏作者
861
文章
1424309
阅读量
422
订阅数
论文 | AKConv魔改YOLO8网络轻松涨点
2023年底出现了一篇论文介绍了一种新的卷积网络结构AKConv,它是可变形卷积网络结构的基础更进一步,实现了一种更加随机的卷积结构与参数选择的卷积神经网络结构,效果比DCN更加厉害,但是随着卷积窗口的增大,参数量却比DCN要少很多,图示如下:
OpenCV学堂
2024-04-02
1370
干货 | 那些鬼斧神工的池化操作,看完我炸裂!
卷积神经网络的最基本结构有卷积层跟池化层,一般情况下,池化层的作用一般情况下就是下采样与像素迁移不变性。根据步长区分,池化可以分为重叠池化与区域池化,图示如下:
OpenCV学堂
2023-10-06
2550
OpenCV4.x的EAST场景文字检测
点击上方蓝字关注我们 微信公众号:OpenCV学堂 关注获取更多计算机视觉与深度学习知识 EAST模型 EAST( An Efficient and Accurate Scene Text Detector)是标题的英文首字母缩写,模型出自旷视科技。相比其他几种场景文字检测模型,表现开挂。在ICDAR 2015数据集上表现优异,见下图: 可以看到红色点标记EAST模型的速度与性能超过之前的模型。EAST模型是一个全卷积神经网络(FCN)它会预测每个像素是否是TEXT或者WORDS,对比之前的一些卷积神经网
OpenCV学堂
2022-08-29
4290
轻松学 Pytorch – 使用DCGAN实现数据复制
Ian J. Goodfellow首次提出了GAN之后,生成对抗只是神经网络还不是深度卷积神经网络,所以有人提出一种基于深度神经网络的生成对抗网络,这个就是DCGAN。相比之前的GAN,DCGAN在生成者与判别者网络上的改进如下:
OpenCV学堂
2020-11-06
8520
汇总 | OpenCV DNN模块中支持的分类网络
OpenCV DNN基于深度学习中的卷积神经网络技术实现对常见计算机视觉任务完成,这些支持模型的结构与相关的论文笔者做了汇总。今天这里汇总一下支持的图像分类模型。
OpenCV学堂
2020-09-08
1.1K0
教程 | 100行代码搞定实时视频人脸表情识别
好就没有写点OpenCV4 + OpenVINO的应用了,前几天上课重新安装了一下最新OpenVINO2020.3版本,实现了一个基于OpenCV+OpenVINO的Python版本人脸表情识别。100行代码以内,简单好用!
OpenCV学堂
2020-07-08
2.3K0
轻松学Pytorch-全卷积神经网络实现表情识别
我又又一周没有更新这个系列文章了,但是我说过我会继续坚持更新下去的,今天给大家更新了一篇如何使用残差Block构建全卷积神经网络实现图像分类,对的,你没有看错就是基于全卷积神经网络实现人脸表情图像的识别,其中数据集一部分来自CK+,更多的是我自己使用OpenVINO的表情识别模型来自动标注的,总数大致有5000张的表情图像。
OpenCV学堂
2020-07-08
8250
轻松学Pytorch – 人脸五点landmark提取网络训练与使用
大家好,本文是轻松学Pytorch系列文章第十篇,本文将介绍如何使用卷积神经网络实现参数回归预测,这个跟之前的分类预测最后softmax层稍有不同,本文将通过卷积神经网络实现一个回归网络预测人脸landmark,这里主要是预测最简单的五点坐标。
OpenCV学堂
2020-06-11
2.1K1
卷积神经网络可视化的直观解析
最早的卷积神经网络是Alexander Waibel在1987[5]年提出的延时神经网络(TDNN)。TDNN是一种应用于语音识别问题的卷积神经网络。它使用FFT预处理的语音信号作为输入,它的隐藏层由两个一维卷积核组成,用于提取频域中不变的平移特征[6]。在TDNN出现之前,人工智能领域在BP神经网络(back-propagation)的研究方面取得了突破性进展[7],因此TDNN能够使用BP框架进行学习。在最初作者的对比实验中,在相同条件下,TDNN的性能优于隐马尔可夫模型(HMM),后者是80年代语音识别的主流算法[6]。
OpenCV学堂
2020-06-11
1K0
轻松学Pytorch – 全局池化层详解
大家好,这是轻松学Pytorch系列的第九篇分享,本篇你将学会什么是全局池化,全局池化的几种典型方式与pytorch相关函数调用。
OpenCV学堂
2020-06-05
4.3K0
轻松学Pytorch-使用卷积神经网络实现图像分类
大家好,本篇教程的贡献者来自社区投稿作者【陨星落云】,使用CIFAR-10数据集进行图像分类。该数据集中的图像是彩色小图像,其中被分为了十类。一些示例图像,如下图所示:
OpenCV学堂
2020-05-24
1.5K0
【深度学习】正则化技术全面了解
正则化就是结构风险最小化策略的实现, 是在经验风险最小化的情况下加入一个正则化项或者罚项。
OpenCV学堂
2020-03-08
1.4K0
性能达到SOTA的CSP对象检测网络
早期传统的对象检测方法都是基于滑动窗口的特征分类,自从深度学习来了之后就产生很多基于深度神经网络效果特别好的对象检测网络模型,比如SSD、YOLO、Faster-RCNN等,但是这些模型都有个缺陷就是依赖anchor设置,总的来说anchor设置对模型最终精度有比较明显的影响。本文中作者通过深度神经网络提取高级抽象语义描述把对象检测中图像上各个对象抽象为BLOB对象检测的中心特征点,同时通过卷积神经网络预测每个中心特征点尺度范围,这样就实现了anchor-free的对象检测网络构建,在几个benchmark对象检测数据集上都取得跟anchor-base网络相同甚至更好的效果。而且针对交叉数据集验证表明该方法有杰出的泛化能力。
OpenCV学堂
2019-08-09
1.1K0
基于感知损失的实时风格迁移与超分辨率重建
许多经典的图像问题都可以被看成是图像变换任务,算法接受一个输入图像,然后输出变换之后的图像。最常见的例子就是图像处理中的取噪、超分辨重建、图像彩色化等问题,输入的图像是退化低质量图像(噪声、低分辨率、灰度化)得到的输出是一个彩色、高分辨率、高质量的图像,此外这类变换还包括图像语义分割、深度评估。以前基于卷积神经网络来解决这类问题通常采用的是像素基本的损失,但是这种方法训练得到模型拟合标注数据与输出结果之后的感知不同,作者正是基于这点提出了基于感知的损失来训练纠正这种偏差。
OpenCV学堂
2019-07-05
8240
OpenVINO车牌识别网络详解
英特尔在OpenVINO模型加速库中设计了一个全新的车牌识别模型用于识别各种车牌包括中文车牌识别,其中在BITVehicle数据集上对中文车牌的识别准确率高达95%以上。官方发布的OpenVINO支持预训练模型中已经包含了LRPNet模型,可以用于实时的车牌识别。
OpenCV学堂
2019-05-15
3.4K0
教程 | OpenCV场景文字检测
OpenCV在TEXT扩展模块中支持场景文字识别,最早的场景文字检测是基于级联检测器实现,OpenCV中早期的场景文字检测是基于极值区域文本定位与识别、最新的OpenCV3.4.x之后的版本添加了卷积神经网络实现场景文字检测,后者的准确性与稳定性比前者有了很大的改观,不再是鸡肋算法,是可以应用到实际场景中的。值得一提的是基于CNN实现场景文字检测算法OpenCV中采用了是华中科技大学贡献的模型,模型结构如下:
OpenCV学堂
2019-04-29
3.9K0
EAST场景文字检测模型使用
EAST( An Efficient and Accurate Scene Text Detector)是标题的英文首字母缩写,模型出自旷视科技。相比其他几种场景文字检测模型,表现开挂。在ICDAR 2015数据集上表现优异,见下图:
OpenCV学堂
2019-03-07
2K0
使用tensorflow layers相关API快速构建卷积神经网络
tf.layers包中包含了CNN卷积神经网络的大多数层类型,当前封装支持的层包括:
OpenCV学堂
2018-12-13
9440
卷积神经网络是如何实现不变性特征提取的
传统的图像特征提取(特征工程)主要是基于各种先验模型,通过提取图像关键点、生成描述子特征数据、进行数据匹配或者机器学习方法对特征数据二分类/多分类实现图像的对象检测与识别。卷积神经网络通过计算机自动提取特征(表示工程)实现图像特征的提取与抽象,通过MLP实现数据的回归与分类。二者提取的特征数据都具不变性特征。
OpenCV学堂
2018-12-06
1.9K0
AlexNet网络的结构详解与实现
在2012年ImageNet图像分类任务竞赛中AlexNet一鸣惊人,对128万张1000个分类的预测结果大大超过其他算法模型准确率,打败其它非DNN网络一鸣惊人。AlexNet包括5个卷积层与三个全连接层,与今天动则十几层、几十层甚至成百上千层相比,简直是太简单、太容易理解啦。AlexNet网络一共有八层。前面5层是卷积层,后面3层是全连接层,整个网络结构显示如下:
OpenCV学堂
2018-07-26
1.4K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档