基于FPGA的均值滤波(二)

基于FPGA的均值滤波(二)

之一维求和模块

均值滤波按照整体设计可以分为以下几个子模块:

(1)一维求和模块,这里记为sum_1D;

(2)二维求和模块,这里记为sum_2D;

(3)除法转换模块,此模块比较简单,一般情况下不进行模块封装。

(4)行缓存电路实现行列间像素对齐。

整个顶层模块调用sum_2D模块和除法转换电路求取平均值,记为mean_2D。

用FPGA来求和是最简单的事情,所要注意的是求和结果不要溢出。一般情况下,2个位宽为DW的数据想家,至少得用一个DW+1位宽的数据来存放。

假设窗口尺寸为5,则求和电路可以根据下图进行设计:

将输入数据流连续打4拍,加上当前数据组成5拍数据,经过3个时钟两两相加运算,即可得到连续5个数据的和。

上面的电路确实可以实现预定的功能,然后本设计中采用另外一种方法:利用增量更新的方式来实现窗口横向求和,这种求和方式在大尺寸的窗口计算中十分有用。

在连续两个像素求和的过程中,仅仅有头尾的两个像素不同。嘉定当前计算地址为n+1,计算结果为sum(n+1),上一个地址为n,计算结果为sum(n),输入数据流为X(i),设定当前计算窗口为5,则有

则有

也就是针对每一个窗口并不需要重新计算所有窗口内的像素和,可以通过前一个中心点的像素和再通过加法将新增点和舍弃点之间的差值计算进去就可以获得新窗口内像素和。

具体到FPGA实现方面,同样需要把数据连续打几拍,同时计算首个数据与最后一个数据的差。当前求和结果为上一个求和结果与计算结果之差的和。同样对于窗口尺寸为5的行方向求和操作,设计带你撸如下图所示:

module sum_1d(
clk,
din,
din_valid,
dout_valid,
dout
 );
parameter DW = 14;//数据位宽参数
parameter KSZ = 3;//求和窗口位宽参数   处理窗口尺寸(KernelSize)
//定义KSZ+1个输入寄存器
reg [DW-1:0] din_reg [0:KSZ];
//定义KSZ+1个输入有效信号
reg [0:0] din_valid_reg [0:KSZ];
//定义一个求和寄存器
reg [2*DW-1:0] sum;
//定义中间信号
wire [2*DW-1:0] sub_out;
//定义减法器输出信号
wire [2*DW-1:0] diff;
//连续缓存KSZ拍数据  同时缓存输入有效信号
always @(posedge clk)
begin
din_reg[0] <= din;
din_reg[1] <= din_reg[0];
din_reg[2] <= din_reg[1];
din_reg[3] <= din_reg[2];
din_valid_reg[0] <= din_valid;
din_valid_reg[1] <= din_valid_reg[0];
din_valid_reg[2] <= din_valid_reg[1];
din_valid_reg[3] <= din_valid_reg[2];
end
//做减法计算差值
assign sub_out = (din_valid_reg[0]&din_valid_reg[KSZ]) ? ({{DW{1'b0}},din_reg[KSZ]}):({2*DW{1'b0}});
assign diff = ({{DW{1'b0}},din_reg[0]}) - sub_out;
//计算最后的求和结果
always @(posedge clk)
begin
if(din_valid & ( ~din_valid_reg[0] ) )
sum <= {2*DW{1'b0}};
else if(din_valid_reg[0])
sum <= sum + diff;
end
//输出信号
assign dout_valid = din_valid_reg[1];
assign dout = sum;
endmodule

原文发布于微信公众号 - 瓜大三哥(xiguazai_tortoise)

原文发表时间:2017-09-01

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏游遵文的专栏

机器学习优化算法:梯度下降(Gradient Descent)

优化算法 ( Optimization Algorithm ) 是机器学习理论中重要的组成部分,每年 ICML 会议中,总会有很多关于优化算法 Paper 以及...

68110
来自专栏企鹅号快讯

深入机器学习系列7-Random Forest

1 Bagging   采用自助采样法()采样数据。给定包含个样本的数据集,我们先随机取出一个样本放入采样集中,再把该样本放回初始数据集,使得下次采样时,样本仍...

50660
来自专栏技术翻译

回归问题的深层神经网络

众所周知,神经网络可用于解决分类问题,例如,它们被用于手写体数字分类,但问题是,如果我们将它们用于回归问题,它会有效果吗?

1.2K20
来自专栏ATYUN订阅号

【学术】实践教程:使用神经网络对犬种进行分类

几天前,我注意到由Kaggle主办的犬种识别挑战赛。我们的目标是建立一个模型,能够通过“观察”图像来进行犬种分类。我开始考虑可能的方法来建立一个模型来对犬种进行...

41650
来自专栏人工智能

机器学习入门之HelloWorld(Tensorflow)

本文介绍一些机器学习的入门知识,从安装环境到跑通机器学习入门程序MNIST demo。

2.7K400
来自专栏fangyangcoder

tensorflow笔记(四)之MNIST手写识别系列一

http://www.cnblogs.com/fydeblog/p/7436310.html

14710
来自专栏贾志刚-OpenCV学堂

SSD网络tensorflow版本源码深入分析

以VGG-16作为特征提取层实现SSD网络的代码,解读SSD网络代码实现的各个细节,从输入参数、默认框的位置匹配、宽高比率、放缩比率、各层默认框的生成、到损失函...

34340
来自专栏Jack-Cui

Caffe学习笔记(七):使用训练好的model做预测(mnist)

Python版本: Python2.7 运行平台: Ubuntu14.04 一、前言     在之前的笔记中,已经生成了训练好的mnist.cafffemod...

54850
来自专栏专知

【最新TensorFlow1.4.0教程02】利用Eager Execution 自定义操作和梯度 (可在 GPU 运行)

点击上方“专知”关注获取更多AI知识! 【导读】主题链路知识是我们专知的核心功能之一,为用户提供AI领域系统性的知识学习服务,一站式学习人工智能的知识,包含人工...

56760
来自专栏AILearning

卷积神经网络

注意:本教程面向TensorFlow 的高级用户,并承担机器学习方面的专业知识和经验。 概观 CIFAR-10分类是机器学习中常见的基准问题。问题是将R...

236100

扫码关注云+社区

领取腾讯云代金券