上期内容:异步跨时钟域电路该怎么约束
DATAFLOW作为HLS的一种优化方法,对于改善吞吐率(Throughput)、降低延迟(Latency)非常有效。
DATAFLOW的作用对象
DATAFLOW可以作用于函数,也可以作用于for循环。如下图所示(图片来源Figure62, Figure 63, ug902)。无论是作用于函数还是for循环,都要求数据在函数之间顺序流动,没有反馈回路。
DATAFLOW优化前后对比
我们看一个简单的案例,如下图所示(图片来源Figure64, ug902)。顶层函数top下调用了3个子函数。这3个子函数之间的数据是顺序流动的,因此可以用DATAFLOW来优化。如果不使用DATAFLOW,意味着func_A处理结束,才能处理func_B,func_B处理结束,才能处理func_C。这其实就是C语言的处理方式即顺序执行。但从硬件角度看,只有func_A有输出数据,就可以传递给func_B进行处理。这就实现了这3个函数的并行处理,从而将II由8降至3,Latency由8降至5。
DATAFLOW的原理
DATAFLOW需要额外的硬件资源开销。这是因为Vivado HLS会对相应的函数或者循环进行分析,然后对中间数据(子函数的输出或者循环体中的变量)进行缓存。缓存可能需要用到FIFO或者采用乒乓Buffer(RAM)的方式,如下图所示(图片来源Figure65, ug902)。通常对于标量,HLS会采用FIFO缓存;对于数组,HLS会采用乒乓Buffer缓存。
在报告中确认DATAFLOW
一旦使用了DATAFLOW,在综合报告中会明确地显示处理。同时,在Analysis窗口中可以看到红色椭圆方框标记的图标,如下图所示。
文 | Lauren 图 | Lauren
Copyright @ Lauren的FPGA
转载事宜请私信 | 获得授权后方可转