文章/答案/技术大牛

发布

社区首页 >问答首页 >Intel SIMD Intrinsics：_mm256_i64scatter_pd

问Intel SIMD Intrinsics：_mm256_i64scatter_pd
EN

Stack Overflow用户

提问于 2019-11-12 02:04:34

回答 1查看 116关注 0票数 0

我在编译英特尔SIMD散点内部函数时遇到了问题。我已经将我的原始代码简化为：

double *tmpMemoryDoubles= (double *) malloc(1024);
__m256i tmpRegisterIndex = _mm256_set_epi64x(0, 1, 2, 3);
__m256d tmpRegisterDouble = _mm256_set_pd(0.0, 0.0, 0.0, 0.0);
_mm256_i64scatter_pd(tmpMemoryDoubles, tmpRegisterIndex, tmpRegisterDouble, 1);

_mm256_i64scatter_pd()的文档将参数定义为：

void   _mm256_i64scatter_pd (void* base_addr, __m256i vindex, __m256d a, const int scale)

以下是错误消息：

/usr/lib/gcc/x86_64-linux-gnu/7/include/avx512vlintrin.h:11152:1: error: inlining failed in call to always_inline 'void _mm256_i64scatter_pd(void*, __m256i, __m256d, int)': target specific option mismatch
_mm256_i64scatter_pd (void *__addr, __m256i __index,
src_avx2/PRE_build_region_impulse_devel_avx2.cpp:631:33: note: called from here
_mm256_i64scatter_pd(tmpMemoryDoubles, tmpRegisterIndex, tmpRegisterDouble, 1);

有没有人看到我做错了什么？

simd

avx2

回答 1

Stack Overflow用户

发布于 2019-11-12 03:16:18

这不是一条AVX2指令。如果你用-march=native编译，编译器给了你这个，你的CPU就没有AVX512VL。AVX2只有聚集；散射器是AVX512的新特性。

GCC和clang需要启用ISA扩展才能发出这些指令，即使您使用的是内部函数。(与MSVC和ICC不同)。您可以使用-mavx512vl或-march=skylake-avx512编译来成功编译，然后在运行时在不支持它的CPU上出错。

这就是target specific option mismatch的意思；如果你在谷歌上搜索inlining failed in call to always_inline和/或target specific option mismatch，你会找到很多关于需要-mwhatever的匹配。

或者，如果您在Intel's intrinsics finder中查找_mm256_i64scatter_pd，您会看到它需要AVX512VL。

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/58806468

复制

相似问题

问Intel SIMD Intrinsics：_mm256_i64scatter_pd
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Intel SIMD Intrinsics：_mm256_i64scatter_pdEN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Intel SIMD Intrinsics：_mm256_i64scatter_pd
EN