首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >C++优化if/C++语句

C++优化if/C++语句
EN

Stack Overflow用户
提问于 2016-10-02 09:56:07
回答 1查看 4.1K关注 0票数 2

我编写了以下代码来模拟和简化我的应用程序中正在发生的事情。

在这个简化过程中,我有ifelse分支,它们正在执行相同的代码,但是在不同的内存部分中编写。因此,我想使用一个由两个条目组成的数组,并根据语句条件更新第一个或第二个条目。

这一解决方案提高了预期的速度。

但是,在执行过程中,每次迭代都有一个随机访问时,改进几乎消失了。为了显示这种奇怪的行为,我使用模板激活或禁用了if-语句和随机访问的使用,即。

useif:当使用if语句时为true,在使用内存访问时为false .

rand_access:当我们对每个迭代都有随机访问时为true,否则为false。

代码语言:javascript
运行
复制
#include <chrono>
#include <iostream>
#include <vector>
#include <numeric>
#include <algorithm>
#define N 1000000000
using namespace std;
using namespace std::chrono;

template <bool useif, bool rand_access>
void exec(vector<int>& V, vector<bool>& B) {
    auto start = high_resolution_clock::now();
    int sum[2], sum1 = 0, sum2 = 0;
    sum[0] = 0; sum[1] = 0;
    for ( int i = 0; i < N; i++ ) {
        const int index = (rand_access) ? V[i] : i;
        if ( useif ){
            if ( B[index] ) sum2 += V[i];
            else sum1 += V[i];
        } else
            sum[B[index]] += V[i];
    }
    auto t = std::chrono::duration_cast<milliseconds>(high_resolution_clock::now() - start);
    std::cout << "Time useif="<<useif<<", rand_access="<<rand_access<<" : " << t.count() << " ms" << std::endl;
    std::cout << (sum1+sum2+sum[0]+sum[1]) << std::endl;
}

int main() {
    vector<int> V(N);
    vector<bool> B(N, false);
    iota( V.begin(), V.end(), 0 );
    random_shuffle( V.begin(), V.end() );
    fill( B.begin(), B.begin() + B.size()/2, true);
    random_shuffle( B.begin(), B.end() );
    exec<false, false>(V, B);
    exec<false, true>(V, B);
    exec<true, false>(V, B);
    exec<true, true>(V, B); 
    return 0;
}

在我的机器上,用g++ --std=c++11 -O3 -march=native -mtune=native编译,得到以下结果:

时间useif=0,rand_access=0:1518 ms

时间useif=0,rand_access=1:10791 ms

时间useif=1,rand_access=0:4384 ms

时间useif=1,rand_access=1:12214 ms

因此,2.8的速度可以用内存访问替换if语句,如果存在而不是随机访问,则性能非常接近(1.1速度加快)。

我不明白为什么会发生这种情况,以及如何处理它,即我如何优化if语句,知道if和分支正在执行相同的代码?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-10-02 10:51:37

使用数组优化if/else是正确的。它总是给你一个进步,但它的重要性也取决于其他因素。

您的实验显示了分支消除和缓存访问优化的相对影响。

当代码按顺序访问内存时,由于引用的局部性,它利用CPU缓存优化,“付费”只访问内存的一小部分。对于存储在连续位置的4字节整数,使用64字节的缓存行,它的作用就像一个不可思议的“购买一个,获得15个免费”策略。它允许CPU继续添加,很少等待内存中的数据。

当代码没有分支时,它利用CPU指令管道。在一个很难预测的情况下,撞上一个if会阻碍管道的运行,因此同时“飞行”的指令就会减少。

从具有分支的随机访问到具有分支的顺序访问,节省了7.8秒;在此基础上,消除分支节省了2.8秒。

相反,在没有顺序访问的情况下消除分支只会给您带来1.5秒的改进,因为当CPU等待内存时,消除管道阻塞就变得不那么重要了。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/39815800

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档