首页
学习
活动
专区
圈层
工具
发布
50 篇文章
1
资源利用率报告中的LUT和LUTRAM有什么区别
2
xilinx verilog语法技巧(三)--RAM的初始化
3
为什么推荐使用XPM?
4
Block RAM的基本结构
5
为什么要用XPM_MEMORY
6
Vivado中用于时钟操作的几个Tcl命令
7
影响FPGA时序的进位链(Carry Chain), 你用对了么??
8
动态时钟相位
9
动态时钟频率
10
如何缩短Vivado运行时间
11
你的FPGA设计有这些缺陷吗
12
report_utilization远比你想象的强大
13
vivado如何快速找到schematic中的object
14
FPGA中的CLOCK REGION和SLR是什么含义
15
FPGA中的BEL, SITE, TILE是什么含义
16
如何快速查找目标cell
17
都是pin,有什么区别
18
都是net,有什么区别
19
一张图看懂cell, pin, net, port
20
如何快速找到组合逻辑生成的时钟
21
【Vivado那些事】Vivado下头文件使用注意事项
22
Pblock可以这么画
23
关于Pblock的8个必知问题
24
常用的跟Pblock相关的Tcl命令
25
【Vivado】那些事儿-汇总篇
26
【Vivado那些事】Xilinx FPGA普通IO能不能直接接入PLL作为时钟输入
27
Storage Elements
28
D触发器都有哪几种类型?对应什么样的代码?
29
Xilinx 7系列FPGA逻辑单元理解
30
Vivado下查看芯片资源
31
对RAM初始化怎么做
32
干货:Vivado 直接修改RAM初始化文件,避免重新综合、实现的方法
33
借助Elaborated Design优化RTL代码
34
一张图理解什么是好的设计层次
35
9个关于SSI芯片的必知问题
36
Vivado 2018.3 report_qor_suggestions怎么用
37
Vivado 2019.1新特性(5):更新的report_qor_suggestions
38
Xilinx的高质量时钟输出ODDR原语【随路时钟】【全局时钟网络】【ZC706输出时钟】【ZYNQ】
39
FPGA中BEL Site Tile FSR SLR分别指什么?
40
跟I/O相关的几个命令
41
Vivado Non-Project模式
42
FPGA中降低时钟skew的几种方法
43
FPGA时序优化之Reduce MUXF Mapping
44
什么是Forwarded Clock?
45
几个常见问题
46
如何让同一层次的模块在布局时更紧凑一些
47
什么情况下要用OOC综合方式
48
Vivado 2019.1新特性(2):report_ram_utilization
49
URAM和BRAM有什么区别
50
write_first/read_first/no_change什么区别
清单首页FPGA文章详情

Block RAM的基本结构

以UltraScale芯片为例,每个Block RAM为36Kb,由两个独立的18Kb Block RAM构成,如下图所示。

每个18Kb Block RAM架构如下图所示。从图中可以看出,Block RAM本身会对输入控制信号(addr, we, en)和输入数据(din)进行寄存(这些寄存器是可选的且在Block RAM内部),同时对输出也可寄存(该寄存器也是可选的)。从而,从输出到输出的最大Latency为2。采用手工编写RTL代码的方式使其映射为Block RAM时,可按照Block RAM的架构描述。需要注意如果需要复位,输出寄存器是带有复位端口的,但仅支持同步高有效。实验证明,只要按照该结构描述,所有的寄存器会映射到Block RAM架构中,不会消耗额外的寄存器。

(图片来源:ug573,figure 1-5)

这两个18Kb的Block RAM可形成如下图所示的4种配置方式。

可通过IP Core (Block Memory Generator)或者XPM_MEMORY的方式使用BlockRAM,但无论通过哪种方式,都需要注意对Block RAM的输出要做寄存处理,尤其是在高速设计中。在使用IP Core时,会有如下图所示的选项,其中的Primitives Output Register为Block RAM自带的寄存器,而CoreOutput Register为SLICE中的寄存器。

进一步说明,这两个寄存器的位置如下图所示。图中的Embedded Output Registers即对应Primitives OutputRegister。

(图片来源pg058,figure 3-17)

类似的,在使用FIFO IP Core时,也会有一个选项Output Registers,其对应的Embedded Registers即为Block RAM自带的寄存器。

Block RAM自带的寄存器(Embedded Registers)对系统性能有很大影响,以VirtexUltraScale Plus芯片为例,在使用该寄存器和未使用该寄存器时,Tco(时钟到输出延迟)的变化还是很大的,这意味着Fmax会因此而发生较大变化。

(图片来源ds923,table 28)

在综合后的网表中,选中设计中的Block RAM,在其Property窗口中,查看DOA_REG和DOB_REG,若其为0,则说明未使用Embedded Registers。

当设计要求Latency为2时,Primitives Output Register和Core Output Register选取其一即可。若系统时钟频率较高,可选择Core Output Register,因为该寄存器的Tco小于Primitives Output Register的Tco,同时CoreOutput Register的布局可兼顾下级时序路径的时序要求;若当前设计触发器利用率较高,同时选择Primitives Output Register可满足系统时序要求,则选择PrimitivesOutput Register可避免进一步增加触发器的利用率。

结论:

-在使用Block RAM时,为便于时序收敛,最好使用Embedded Registers

上期内容:

查找表用作分布式RAM

下期内容:

Block RAM的性能与功耗

下一篇
举报
领券