首页
学习
活动
专区
圈层
工具
发布
37 篇文章
1
Linux音频驱动-ASOC(ALSA System on Chip)
2
LPDDR5: A New Clocking Scheme 提高性能
3
FPGA 控制 RGMII 接口 PHY芯片基础
4
DDR3篇第三讲、DDR3读写测试项目分析
5
PHY(Physical Layer,PHY)通俗理
6
MIPI联盟已完成车载的Long-Reach SerDes PHY工业标准 A-PHY v1.0
7
【三】Bluetooth 技术||链路层七种状态与空口报文设计(Core_v5.2)
8
【RL-TCPnet网络教程】第5章 PHY芯片和STM32的MAC基础知识
9
FPGA和USB3.0通信-USB3.0 PHY介绍
10
USB技术浅析
11
优秀的 Verilog/FPGA开源项目介绍(二)-RISC-V
12
优秀的 Verilog/FPGA开源项目介绍(十六)- 数字频率合成器DDS
13
想学习高速ADC/DAC/SDR项目这个项目你不得不理解
14
优秀的 Verilog/FPGA开源项目介绍(九)- DP(增改版)
15
优秀的 Verilog/FPGA开源项目介绍(十三)- I2C
16
高速串行通信常用的编码方式-8b/10b编码/解码
17
SoC设计之PPA
18
SoC设计之功耗--开篇
19
开源SOC的设计与实践
20
SoC设计之功耗 – RTL/netlist功耗计算
21
转置型FIR设计
22
SSD目标检测系统系统结构网络训练
23
P2P接口Booth乘法器设计描述原理代码实现
24
流水线式p2p接口的分析与实现
25
流水线乘加树需求设计规划代码实现
26
分时复用的移位相加乘法器
27
Verilog实现全并行比较算法
28
全并行流水线移位相加乘法器
29
ROM乘法器基本算法单个ROM乘法器分时复用ROM乘法器
30
Flash中XIP模式
31
cordic的FPGA实现(五)、除法实现
32
cordic的FPGA实现(三)、乘法器实现
33
cordic的FPGA实现(三)、sin、cos函数运算与源码分析
34
FPGA卡拉ok系统--Biquad filter
35
音频总线I2S协议
36
脉冲压缩处理
37
虚拟地址(VA,virtual address)到物理地址(PA, ,physical address)的转换
清单首页SoC文章详情

流水线式p2p接口的分析与实现

0.简介

P2P接口是一种双向握手接口,传输的前级和后级各提供一个数据有效信号valid和忙信号busy信号,只有当两个信号达成某种指定情况时,握手完成,数据传输完成,否则数据传输均未完成。这可以看成一种分布式控制方式,每个模块的开发人员仅需要考虑上下级的握手信号即可。

1.端口

端口名

类型

位宽

功能

din_valid

input

1

输入数据有效信号

din_busy

output

1

输入部分忙,不接受输入数据

dout_valid

output

1

输出有效信号

dout_busy

input

1

输出部分忙,下一级不接受输入

din

input

-

输入数据

dout

output

-

输出数据

2.状态分析

2.1.输入状态分析

din_valid

din_busy

状态

0

0

静默,无数据传输

1

0

正常接收数据,无阻塞情况发生

0

1

输入忙,但无数据输入

1

1

输入数据被阻塞

2.2.输出状态分析

dout_valid

dout_busy

状态

0

0

静默,无数据传输

1

0

正常发送数据,无阻塞情况发生

0

1

输出忙,但无数据输出

1

1

输出数据被阻塞

2.3.组合情况分析

din_valid

din_busy

dout_valid

dout_busy

状态

1

1

1

1

全阻塞

1

0

1

1

接收在本级被阻塞的数据

1

1

1

0

释放被阻塞被本级的数据

3.结构框图

3.1.结构

p2p_structure.png

  • Input:数据输入接口
  • Lock reg:输入锁存器,当阻塞时在本级存储被阻塞的数据
  • combinatiorial logic:处理逻辑,用于处理输入数据
  • output reg:输出寄存器

3.2.分析

下图分析了一个在四级流水线中数据的传输过程,其中:

  • 白色的方块表示正常工作没有阻塞的模块
  • 红色的方块表示阻塞的模块(dout_busy=1)
  • 箭头上的数据表示在上一个模块输出的数据
  • 方块中的数据表示被存储在模块中的数据

p2p_analysis.png

分析过程如下:

  1. 最后一级dout_busy=1,din_busy=0,则刚遇到阻塞,将上一级输入存储在本级lock reg中
  2. 最后一级din_busy=1,即第三级dout_busy=1,此时数据B已经位于第三级output reg中,第三级将输入数据C存储在第三级的lock reg中
  3. ...
  4. 当最后一级dout_busy=1且din_busy=0时,下一级阻塞解除,第四级output reg中的数据已经被之后接收
  5. 最后一级din_busy=0即第三级dout_busy=0时,第四级阻塞解除,原先存储在第四级lock reg中的数据A已经被送到output reg中传送到下一级,同时接收存储在第三级output reg中的数据B
  6. 第三级din_busy=0即第二级dout_busy=0时,第三级阻塞解除,原先存储在第三级lock reg中的数据C被送到output reg中传送到下一级,同时接收存储在第二级output reg中的数据D
  7. ...

3.3.时序图分析

p2p_noraml.png

上图为一个通常情况的可用于流水线的P2P接口时序图,当连续传递无阻塞时(d0和d1),busy信号复位,valid信号和数据相对于上一级延迟一个时钟周期。d2~d5表示的是在流水线过程中发送后级阻塞的处理方法:

  • 当后级流水线发生阻塞时,该阻塞在一个时钟周期后反馈到前级
  • 由于前级反馈产生busy信号由后级busy信号寄存产生,而后级的输出由前级输出寄存(处理)产生,因此两个busy信号之间差了两个数据(前级卡在端口的数据为d5,而后级卡在端口的数据为上上个数据d3)
  • 由于相差两个数据,则需要一个深度为1旁路缓存暂存中间的数据d4
  • 当后级busy信号复位后,完成未完成传输d3后,立刻从旁路缓存中取出d4进行传输,此时前级的数据d5完成传输,在下一个时钟周期由后级转发

p2p_start_with_busy.png

上图是传输开始时就有后级busy信号的情况,可以发现,该情况与上一种情况相同,参照上一种情况可分析。

p2p_one_cycle.png

上图是仅传输一个单独数据且遇到阻塞的情况,该情况最大的不同是din_valid信号仅置位一个时钟周期,而dout_valid要等发送数据d2完成发送后再复位,因此两个valid信号之间并不是简单的延迟一个周期的关系。

p2p_two_cycle.png

上图是最后一个典型情况——仅发送两个数据且遇到阻塞的情况:

  • 前级发送第一个数据d2时,后级阻塞,但是由于后级无传输行为,因此不阻塞该传输
  • 后级接受到数据d2,并发生阻塞情况,同时后级的阻塞还未传输到前级,此时前级发送数据d3
  • 后级发送数据d2未完成,但前级d3发送已经完成,因此d3被存入旁路缓存,等待发送,同时前级静默
  • 后级发送d2完成时,从旁路缓存中取出数据d3进行发送

4.实现细节

首先定义了一些用于简化判断的wire型变量:

代码语言:javascript
复制
wire busy_drop_buf  = (!dout_busy)  && din_busy                     ;
wire is_din_busy    = dout_busy     && dout_valid                   ;
wire is_no_dout     = (!lock_valid) && (!(din_valid && (!din_busy)))  ;
wire is_lock        = is_din_busy   && (!din_busy)  && din_valid     ;
wire is_unlock      = busy_drop_buf && lock_valid                   ;

busy_drop_buf表示dout_busy信号下降沿,该信号在后期判断中经常使用;is_din_busy表示后级发生阻塞行为,当后级的valid和busy同时置位时,表示后级有数据未完成传输,此时阻塞信号应传递到前级;is_no_dout表示没有数据需要发送,即旁路缓存中没有数据且上一级没有发送给这一级的数据;is_lockis_unlock分别表示数据存入旁路缓存和数据从旁路缓存中取出,其中:

  • is_lock:当后级发生阻塞(is_din_busy)且尚未传到前级完成一次数据传输((!din_busy) && din_valid)时有效,即后级发生第一个阻塞时将前级发送的数据放到旁路缓存中(该数据不做特殊处理会丢失)
  • is_unlock:当后级阻塞接触的第一个周期(busy_drop_buf)完成后,若缓存中有数据,则取出发送

4.1.旁路缓存

旁路缓存用于在打断busy反馈的组合路径且不丢失数据,该部分分为两个信号:

  • lock_data:缓存数据,用存储数据
  • lock_valid:缓存有效,用于标记lock_data中的数据是否有效
代码语言:javascript
复制
always @ (posedge clk or negedge rst_n) begin
    if(~rst_n) begin
        lock_valid <= 1'b0;
    end else if(is_lock) begin
        lock_valid <= 1'b1;
    end else if(is_unlock) begin
        lock_valid <= 1'b0;
    end
end

always @ (posedge clk or negedge rst_n) begin
    if(~rst_n) begin
        lock_data <= 'b0;
    end else if(is_lock) begin
        lock_data <= din_data;
    end
end

这两个信号控制基本相同,通过is_lockis_unlock分别进行进缓存和出缓存控制。

4.2.dout_valid

由上分析,当上一级传输完成时,需要将上级传输来的数据转发给下一级,此时dout_valid信号置位;当当前传输完成且没有需要发送的数据时,后级没有需要发送的数据,dout_valid信号复位,代码如下所示:

代码语言:javascript
复制
always @ (posedge clk or negedge rst_n) begin
    if(~rst_n) begin
        dout_valid <= 1'b0;
    end else if(din_valid && (!din_busy)) begin
        dout_valid <= 1'b1;
    end else if(dout_valid && (!dout_busy) && is_no_dout) begin
        dout_valid <= 1'b0;
    end
end

4.2.din_busy

din_busy信号由寄存器产生,因此可以打断从最后一级向前传递的组合逻辑busy反馈路线,当后级发生阻塞时,前级不能继续发送数据,此时该信号置位;当后级busy信号复位后,无论是否发送数据,均可接收新数据(参考时序图分析),因此当后级busy信号复位后该信号复位。

代码语言:javascript
复制
always @ (posedge clk or negedge rst_n) begin
    if(~rst_n) begin
        din_busy <= 'b0;
    end else if(is_din_busy) begin
        din_busy <= 1'b1;
    end else if(!dout_busy) begin
        din_busy <= 'b0;
    end
end

4.3.dout_data

dout_data信号为转发数据,有三种情况:

  • 后级阻塞(is_din_busy):阻塞情况下,输出数据不能改变
  • 释放缓存(is_unlock):达成缓存释放条件,此时从缓存中取出数据发送
  • 其他情况:发送前级传递来的数据

整体代码如下所示:

代码语言:javascript
复制
always @ (posedge clk or negedge rst_n) begin
    if(~rst_n) begin
        dout_data <= 'b0;
    end else if(is_din_busy) begin
        dout_data <= dout_data;
    end else if(is_unlock) begin
        dout_data <= lock_data;
    end else begin
        dout_data <= din_data;
    end
end
下一篇
举报
领券