目前,我正在比较四核处理器上某些代码的串行实现和并行实现。我想了解/衡量的一件事是,当串行代码在单个核心上运行时,它是如何执行的。
当我编译串行代码时,我使用gcc的-O3选项,一开始我注意到序列代码做得不太差。然而,我注意到的一件事是,当我在其中一个核上运行另一个计算密集型进程时,串行版本的性能下降了。
以下是一些数字:
Total Time elapsed: 1s, 233ms <- only serial code is running
Total Time elapsed: 1s, 238ms <- only serial code is running
Total Tim