问如何正确对[模板] C++程序进行基准测试
EN

Stack Overflow用户

提问于 2009-01-12 06:46:22

回答 11查看 4K关注 0票数 7

< backgound>

我正处在一个真正需要优化C++代码的阶段。我正在为分子模拟编写一个库，我需要添加一个新的特性。过去，我已经尝试过添加这个特性，但是后来我使用了嵌套循环中调用的虚拟函数。我对此有不好的感觉，第一个实现证明了这是个坏主意。然而，这是可以测试的概念。

< /background>

现在我需要这个功能尽可能快(好吧，没有汇编代码或GPU计算，这仍然必须是C++和更多可读性而不是更少)。现在，我对模板和类策略有了更多的了解(来自Alexandrescu的优秀著作)，我认为编译时代码生成可能是解决方案。

然而，在完成将其实现到库中的巨大工作之前，我需要对设计进行测试。问题在于测试这一新特性的效率的最佳方法。

显然，我需要打开优化，因为如果没有这个g++ (可能还有其他编译器)，目标代码中就会保留一些不必要的操作。我还需要大量使用基准测试中的新特性，因为1e-3秒的增量可以区分好的设计和糟糕的设计(这个特性在实际程序中将被称为百万次)。

问题是，g++有时在优化时“太聪明”，如果它认为计算结果从未被使用，它可以删除整个循环。在查看输出程序集代码时，我已经看到过一次。

如果我将一些打印添加到stdout中，那么编译器将被迫在循环中执行计算，但我可能主要是对iostream实现进行基准测试。

那么，如何对从库中提取的一个小特性执行正确的基准测试呢？相关问题:在一个小单元上进行这种体外测试是一种正确的方法，还是我需要完整的上下文？

谢谢你的建议！

似乎有几种策略，从允许微调的编译器特定选项到更通用的解决方案，这些解决方案应该适用于每个编译器，比如volatile或extern。

我想我会尝试所有这些。非常感谢你所有的答案！

benchmarking

c++

optimization

实时音视频9.9元起，弱网高质量通信

9.9元畅享2万分钟实时音视频通话时长，低成本、低门槛快速接入端到端延时＜300ms 的高品质实时互动通话

回答 11

Stack Overflow用户

回答已采纳

发布于 2009-01-13 07:09:17

如果要强制任何编译器不丢弃结果，请将结果写入易失性对象。根据定义，无法优化该操作。

template<typename T> void sink(T const& t) {
   volatile T sinkhole = t;
}

没有iostream开销，只需在生成的代码中保留一个副本。现在，如果您正在收集许多操作的结果，最好不要一个一个地丢弃它们。这些副本仍然可以增加一些开销。相反，以某种方式收集单个非易失性对象中的所有结果(因此需要所有单独的结果)，然后将结果对象分配给易失性对象。例如，如果您的单个操作都生成字符串，则可以通过将所有char值一起添加到模块化1<<32来强制求值。这几乎不会增加任何开销；字符串可能在缓存中。加法的结果随后会被分配给易失性，所以每个刺中的每一个字符实际上都必须被计算，不允许捷径。

票数 6