有人看到下面的循环代码有什么明显的地方吗?我没有看到为什么as 2012的C++编译器不能自动向量化循环代码?当我使用info C5002: loop not vectorized due to reason '1200'命令行开关时,编译器给我的全部是/Qvec-report:2。原因1200在MSDN中记录为:
循环包含循环携带的数据依赖项,以防止矢量化。循环的不同迭代相互干扰,从而使循环<
我有一个函数,我想把剩余的循环矢量化。我相信它是正确的,我对性能很满意,但我只想了解更多关于向量化代码的知识。其职能是: # A : d*d numpy array # x : N x d or lengthb = np.zeros(x.shape[0], dtype=np.bool) xmc = x[row, :