我有一个关于Microsoft PPL库的问题,以及一般的并行编程。我正在使用FFTW执行64 x 64 x 64 FFT和逆向FFT的大型集合(100,000)。(请注意,这仍然比我测试过的FFTW提供的内置线程FFTW的利用率更高)。由于我使用的是fftw_malloc,有没有可能发生了过多的锁定,从而阻止了全部使用?有鉴于此,在主处理循环之前为每个线程预先分配存储阵列是否可取,这样循环本身就不需要锁了?如果是这样的话,使用MSFT PPL库是如何实现的呢?我以前一直在使用OpenMP,在这种情况下,使用提供的函数获取