我有如下所示的代码,并希望将其矢量化。我用一个情报顾问分析了整个代码。它说我不能把它矢量化,因为它里面有数学函数。当然,它指出了循环中使用的sin和cos函数。
如何在不使用英特尔短向量数学库的情况下矢量化这个循环?
代码:
for (size_t j = 0; j < NA; ++j) {
esf = sfs[j];
x = p_data[3 * j];
y = p_data[3 * j + 1];
z = p_data[3 * j + 2];
p = x * qx + y * qy + z * qz;
Ar += esf * cos(p);
Ai += esf * sin(p);
}
发布于 2020-09-17 07:58:20
,它说我不能把它矢量化,因为里面有数学函数。
实际上,阻止矢量化的是Ar +=
和Ai +=
术语,因为这意味着j = 2
的输出将取决于j = 1
的输出。如果Ar
和Ai
只是输出,则可以将它们改为数组,并在运行循环后对它们进行求和。
// init to 0
double Ar_elem[NA] = {0.0};
double Ai_elem[NA] = {0.0};
for (size_t j = 0; j < NA; ++j) {
esf = sfs[j];
x = p_data[3 * j];
y = p_data[3 * j + 1];
z = p_data[3 * j + 2];
p = x * qx + y * qy + z * qz;
Ar_elem[j] = esf * cos(p);
Ai_elem[j] = esf * sin(p);
}
//sum
double Ar = std::accumulate(begin(Ar_elem), end(Ar_elem), 0, plus<double>());
double Ai = std::accumulate(begin(Ai_elem), end(Ai_elem), 0, plus<double>());
https://stackoverflow.com/questions/63933350
复制相似问题