首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

当使用AVX2进行编译时,Eigen无法编译,并显示"Reference to EBX in function requiring alignment“。

当使用AVX2进行编译时,Eigen无法编译,并显示"Reference to EBX in function requiring alignment"的错误信息。这个错误通常是由于编译器对于EBX寄存器的对齐要求导致的。

EBX寄存器是x86架构中的一个通用寄存器,它在函数调用过程中被用于保存基址。在使用AVX2指令集进行编译时,编译器要求EBX寄存器必须按照一定的对齐方式进行访问,以保证指令的正确执行。然而,由于Eigen库的某些函数在使用EBX寄存器时没有满足对齐要求,导致编译错误。

要解决这个问题,可以尝试以下几种方法:

  1. 禁用AVX2指令集:如果你的应用程序不需要AVX2指令集的特性,可以在编译选项中禁用AVX2。具体的方法取决于你使用的编译器和构建系统。例如,对于GCC编译器,可以使用"-mno-avx2"选项来禁用AVX2。
  2. 修改Eigen库的代码:如果你对Eigen库的代码比较熟悉,可以尝试修改相关函数的实现,使其满足EBX寄存器的对齐要求。具体的修改方法取决于具体的函数和编译器。
  3. 使用其他优化选项:除了AVX2,还有其他的优化选项可以提高代码的性能。你可以尝试使用其他的优化选项,例如SSE指令集或者其他的编译器优化选项,来替代AVX2。

总结起来,当使用AVX2进行编译时,Eigen无法编译,并显示"Reference to EBX in function requiring alignment"的错误信息,这是由于编译器对于EBX寄存器的对齐要求导致的。解决这个问题的方法包括禁用AVX2指令集、修改Eigen库的代码以满足对齐要求,或者使用其他优化选项来替代AVX2。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

《深入理解计算机系统》(CSAPP)读书笔记 —— 第三章 程序的机器级表示

在之前的《深入理解计算机系统》(CSAPP)读书笔记 —— 第一章 计算机系统漫游文章中提到过计算机的抽象模型,计算机利用更简单的抽象模型来隐藏实现的细节。对于机器级编程来说,其中两种抽象尤为重要。第一种是由指令集体系结构或指令集架构( Instruction Set Architecture,ISA)来定义机器级程序的格式和行为,它定义了处理器状态、指令的格式,以及每条指令对状态的影响。大多数ISA,包括x86-64,将程序的行为描述成好像每条指令都是按顺序执行的,一条指令结束后,下一条再开始。处理器的硬件远比描述的精细复杂,它们并发地执行许多指令,但是可以采取措施保证整体行为与ISA指定的顺序执行的行为完全一致。第二种抽象是,机器级程序使用的内存地址是虚拟地址,提供的内存模型看上去是一个非常大的字节数组。存储器系统的实际实现是将多个硬件存储器和操作系统软件组合起来。

03

各种开源汇编、反汇编引擎的非专业比较

由于平时业余兴趣和工作需要,研究过并使用过时下流行的各种开源的x86/64汇编和反汇编引擎。如果要对汇编指令进行分析和操作,要么自己研究Intel指令集写一个,要么就用现成的开源引擎。自己写太浪费时间,又是苦力活,还容易出错,所以还是使用现成的好一点。 这里对我曾使用过的比较流行的反汇编引擎做个比较,我使用过的反汇编引擎有: 1. Ollydbg的ODDisassm   Ollydbg的ODDisassm,这是我最早使用的一个开源的反汇编引擎,07年在《加密解密》(三) 中我写的一个很简单的虚拟机就是使用的这个库,因为那个时候还没有那么多可选择。不过多亏有这样一个基础库,整个虚拟机从设计到开发完成只用了两个星期便开发完成(当时对反汇编库的要求不高,只要求能用字符串文本做中间表示进行编码/解码)。   这个反汇编库的优点是含有汇编接口(即文本解析,将文本字符串解析并编码成二进制),就拿这个特性来说在当时也算是独树一帜的了,到目前为止开源界在做这个工作的人也很少,   不过近年出现的调试器新秀x64dbg,也附带开发了开源的汇编库XEDParse,功能与OD的文本解析功能相似,并且支持的指令集更加完整,BUG更少,同时还支持X64,维护一直很强劲。 但是ODDisassm的缺点也很多,比如:   1. 指令集支持不全,由于Ollydbg年久失修,现在甚至连对MMX指令集都不全,而现在的INTEL/AMD的扩展指令集标准又更新了多个版本,什么SSE5/AVX/AES/XOP就更别提了,完全无法解析。   2. 解码出来的结构不详细,比如指令前缀支持不够友好,这点从Ollydbg的反汇编窗口可以看出,除了movs/cmps等指令以外,repcc与其他指令组合时都是单独分开的; 再比如寄存器无法表示ah\bh\ch\dh这种高8位寄存器。   3. 作者一次性开源后便不再维护开源版本,对于反汇编上的BUG很难即时修复。   不过这些也可以理解,因为在当时作者的开发目的是进行文本汇编\反汇编,所以没有为解码出的信息建立结构体以及接口。总的来说,如今再使用这个反汇编引擎,已经落后于时代了。 2. BeaEngine BeaEngine是我用的第二个库,当时使用OD库已经不能满足我的需求了。在做反编译器的时候,需要一个能够解码信息越多越好的库,于是我找到了BeaEngine,这个库我记得以前的版本不支持高8位寄存器识别,现在的版本也支持了。   在使用过程中基本上没有发现什么明显的缺点,不常用的新的扩展指令集也实现了不少。   目前实现的扩展指令集有:

03

可以让深度学习编译器来指导算子优化吗

之前在阅读Ansor论文的时候(https://zhuanlan.zhihu.com/p/390783734)我就在想这样一个问题,既然Ansor是在人为指定的推导规则下启发式的生成高性能的Scheduler模板。那么这个算子生成的Scheduler模板是否可以反过来指导我们写程序呢?嗯,然后我就开启了这个实验,但最近因为工作的事情delay得厉害,终于在这个周末抽出时间来更新这个实验结果并且记录了这篇文章。由于笔者只对GEMM的优化熟悉,这里就以优化X86的GEMM为例子来探索。希望这篇文章能为你带来启发,文章所有的实验代码都放到了https://github.com/BBuf/tvm_learn ,感兴趣的可以点个star一起学习(学习TVM的4个月里,这个工程已经收到了快100star了,我很感激)。

04
领券