问哪些优化应该留给编译器？
EN

Stack Overflow用户

提问于 2022-02-16 15:21:34

回答 4查看 102关注 0票数 1

假设您已经选择了最有效的算法来解决性能是第一优先的问题，而现在您正在实现它，那么您必须决定如下所示的细节：

v[i*3+0]，v[i*3+1]和v[i*3+2]包含了粒子i的速度分量，我们要计算出总动能。考虑到所有粒子的质量都一样，人们可以写：

inline double sqr(double x)
{
    return x*x;
}

double get_kinetic_energy(double v[], int n)
{
    double sum = 0.0;

    for (int i=0; i < n; i++)
        sum += sqr(v[i*3+0]) + sqr(v[i*3+1]) + sqr(v[i*3+2]);

    return 0.5 * mass * sum;
}

为了减少乘法次数，它可以写成：

double get_kinetic_energy(double v[], int n)
{
    double sum = 0.0;

    for (int i=0; i < n; i++)
    {
        double *w = v + i*3;
        sum += sqr(w[0]) + sqr(w[1]) + sqr(w[2]);
    }

    return 0.5 * mass * sum;
}

(人们可以用更少的乘法来编写函数，但这不是问题的重点)

现在我的问题是:既然许多C编译器可以自动进行这种优化，那么开发人员应该在哪里依赖编译器，她/他应该在哪里尝试手动进行一些优化呢？

optimization

Stack Overflow用户

发布于 2022-02-16 16:13:11

开发人员应该在哪里依赖编译器，她/他应该在哪里尝试手动进行一些优化？

，我是否对目标硬件有相当深入的了解，以及C代码如何转换成汇编程序？如果不是，忘记手动optimizations.

在这段代码中是否存在明显的瓶颈--我如何知道它首先需要优化？明显的罪魁祸首是I/O、复杂循环、忙等待循环、朴素算法等。

当我发现这个瓶颈时，

如何准确地对其进行基准测试，并且我是否确定问题不在于基准测试方法本身？经验表明，在10个奇怪的性能问题中，大约有9个可以用不正确的基准来解释。包括:禁用编译器优化的基准测试.

从那时起，你就可以开始研究系统特定的东西，以及算法本身--有太多的事情要看，无法用这样的答案来回答。优化低端微控制器的代码和64位的桌面PC (以及两者之间的一切)是一个巨大的区别。

票数 5

查看全部 4 条回答

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/71144522

复制

相似问题

问哪些优化应该留给编译器？
EN

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问哪些优化应该留给编译器？EN

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问哪些优化应该留给编译器？
EN