开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

当“增强指令集”标志被禁用时，当Visual C++编译器遇到AVX指令时会发生什么？

当"增强指令集"标志被禁用时，当Visual C++编译器遇到AVX指令时，会发生以下情况：

编译错误：编译器会报错，指示AVX指令无法使用，因为AVX指令需要"增强指令集"标志的支持。
编译警告：编译器可能会发出警告，提醒开发者AVX指令无法使用，但编译过程会继续进行。
降级处理：编译器可能会自动将AVX指令转换为适用于非AVX指令集的等效指令，以确保代码的可执行性。这种转换可能会导致性能下降，因为AVX指令通常能够提供更高的计算效率。

需要注意的是，以上情况可能会因编译器版本和编译器设置而有所不同。为了确保代码的正确性和性能，开发者应该在编译器选项中启用"增强指令集"标志，以支持AVX指令的使用。

关于AVX指令集的更多信息，可以参考腾讯云的产品介绍链接地址：AVX指令集介绍。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

最好的 Windows C++ 编译器

在技术不断更迭的软件开发世界中，市场上 C++ 编译器的数量开始持续呈现下降趋势。而随着新的高级 C++ 标准（C++ 17、C++ 20）、新的指令集扩展、以及代码优化的更高标准的出现，究竟什么样的编译器才算优秀？

03

AVX图像算法优化系列一: 初步接触AVX。

弄了SSE指令集，必然会在不同的场合不同的人群中了解到还有更为高级的AVX指令集的存在，早些年也确实有偶尔写点AVX的函数，但是一直没有深入的去了解，今年十一期间也没到那里去玩，一个人在家里抽空就折腾下这个东西，也慢慢的开始了解了这个东西，下面是基于目前的认知对这个东西进行下一个简单的小结，有些东西也许是不正确或者不全面的，但应该无伤大雅。

01

使用OpenCV中的universal intrinsics为算法提速 (2)

前言：因为新型冠状病毒导致疫情，最近几日各种新闻和消息满天飞。疫情之下不易出行、不宜聚会；宜宅在家、宜阅读、宜学习、宜写代码。鉴于此，本系列第2篇提前发布。希望大家过一个充实的春节。

01

程序员大神Linus转投AMD：我希望英特尔的AVX 512指令集「去死」

Linux 首席架构师，当今全球最著名程序员之一 Linus Torvalds 最近在邮件列表中的言论再次引起一片哗然。

01

NumPy 1.26 中文文档（四十九）

多年来，NumPy 为第三方扩展暴露的 API 已发展壮大，并使程序员能够直接从 C 中访问 NumPy 功能。这个 API 最好被描述为“有机的”。它是由多种竞争性的愿望和多种观点多年形成的，受到希望使用户能够从 Numeric 和 Numarray 迁移到 NumPy 方面的强烈影响。核心 API 始于 1995 年的 Numeric，并有一些模式，比如大量使用宏来模仿 Python 的 C-API 以及适应 90 年代晚期的编译器技术。只有一小群志愿者很少有时间投入到改进这个 API 上。

01

各种开源汇编、反汇编引擎的非专业比较

由于平时业余兴趣和工作需要，研究过并使用过时下流行的各种开源的x86/64汇编和反汇编引擎。如果要对汇编指令进行分析和操作，要么自己研究Intel指令集写一个，要么就用现成的开源引擎。自己写太浪费时间，又是苦力活，还容易出错，所以还是使用现成的好一点。这里对我曾使用过的比较流行的反汇编引擎做个比较，我使用过的反汇编引擎有： 1. Ollydbg的ODDisassm 　　Ollydbg的ODDisassm，这是我最早使用的一个开源的反汇编引擎，07年在《加密解密》（三）中我写的一个很简单的虚拟机就是使用的这个库，因为那个时候还没有那么多可选择。不过多亏有这样一个基础库，整个虚拟机从设计到开发完成只用了两个星期便开发完成（当时对反汇编库的要求不高，只要求能用字符串文本做中间表示进行编码/解码）。　　这个反汇编库的优点是含有汇编接口（即文本解析，将文本字符串解析并编码成二进制），就拿这个特性来说在当时也算是独树一帜的了，到目前为止开源界在做这个工作的人也很少，　　不过近年出现的调试器新秀x64dbg，也附带开发了开源的汇编库XEDParse，功能与OD的文本解析功能相似，并且支持的指令集更加完整，BUG更少，同时还支持X64，维护一直很强劲。但是ODDisassm的缺点也很多，比如：　　1. 指令集支持不全，由于Ollydbg年久失修，现在甚至连对MMX指令集都不全，而现在的INTEL/AMD的扩展指令集标准又更新了多个版本，什么SSE5/AVX/AES/XOP就更别提了，完全无法解析。　　2. 解码出来的结构不详细，比如指令前缀支持不够友好，这点从Ollydbg的反汇编窗口可以看出，除了movs/cmps等指令以外，repcc与其他指令组合时都是单独分开的；再比如寄存器无法表示ah\bh\ch\dh这种高8位寄存器。　　3. 作者一次性开源后便不再维护开源版本，对于反汇编上的BUG很难即时修复。　　不过这些也可以理解，因为在当时作者的开发目的是进行文本汇编\反汇编，所以没有为解码出的信息建立结构体以及接口。总的来说，如今再使用这个反汇编引擎，已经落后于时代了。 2. BeaEngine BeaEngine是我用的第二个库，当时使用OD库已经不能满足我的需求了。在做反编译器的时候，需要一个能够解码信息越多越好的库，于是我找到了BeaEngine，这个库我记得以前的版本不支持高8位寄存器识别，现在的版本也支持了。　　在使用过程中基本上没有发现什么明显的缺点，不常用的新的扩展指令集也实现了不少。　　目前实现的扩展指令集有：

03

讲解cl: 命令行 error D8021 :无效的数值参数“/Wno-cpp” 和 cl: 命令行 error D8021 :无效的数值参数“/Wno-unu

在使用Microsoft Visual Studio（通常是在Windows操作系统下）进行C++编程时，我们可能会遇到名为"cl"的命令行编译器和错误消息"D8021: 无效的数值参数"。这些错误消息通常与参数"/Wno-cpp"和"/Wno-unused-function"相关。

01

TiFlash 面向编译器的自动向量化加速

SIMD（Single Instruction Multiple Data）是一种采用一个控制器来控制多个处理器，同时对一组数据（又称“数据向量”）中的每一个分别执行相同的操作从而实现空间上的并行性的技术，是重要的程序加速手段。本文将简要介绍一些在 TiFlash 中使用编译器进行自动向量化所需要的入门知识。

02

Intel 的AVX2指令集解读

在Intel Sandy Bridge微架构中，Intel引入了256位SIMD扩展AVX，这套指令集在兼容原MMX、SSE、SSE2对128位整点SIMD支持的基础上，把支持的总向量数据宽度扩展成了256位。新增了若干条256位浮点SIMD指令。

03

OpenCV加速与优化，让代码执行速度飞起来

针对对一个问题，OpenCV开发包包含的东西太多了，大而全，而它们的项目可能需要只是一点点，需要的是小而精，其实这个很容易解决，这个就是要求做好OpenCV的模块裁剪与移植，通过CMake自己编译，关于这个问题，我也写过一篇文章来介绍，感兴趣可以点击这里：

06

Go汇编语法和MatrixOne使用介绍

MatrixOne是一个新一代超融合异构数据库，致力于打造单一架构处理TP、AP、流计算等多种负载的极简大数据引擎。MatrixOne由Go语言所开发，并已于2021年10月开源，目前已经release到0.3版本。在MatrixOne已发布的性能报告中，与业界领先的OLAP数据库Clickhouse相比也不落下风。作为一款Go语言实现的数据库，可以达到C++实现的数据库一样的性能，其中一个很重要的优化就是利用Go语言自带的汇编能力，来通过调用SIMD指令进行硬件加速。本文就将对Go汇编及在MatrixOne的应用做详细介绍。

03

[强基固本-视频压缩]第十二章：向量指令第一部分

向量计算是在执行单个处理器指令时，对多个数据块同时执行相同类型的多个操作。这一原理也被称为 SIMD（单指令多数据）。这个名字源于与向量代数的明显相似性：向量之间的操作具有单一符号表示，但涉及对向量各分量执行多个算术操作。

01

湖仓一体 - Apache Arrow的那些事

Arrow是高性能列式内存格式标准。它的优势：高效计算：所有列存的通用优势，CPU缓存友好、SIMD向量化计算友好等；零序列化/反序列化：arrow的任何数据结构都是一段连续的内存，在跨进程/跨及其传输数据时直接发送/接收整段内存即可，不需要序列化和反序列化；完善的数据类型和生态；支持跨语言跨系统互操作。

01

PGI OpenACC 2018版：原来你是这样的编译器

对于CUDA Fortran用户来说，PGI编译器是必然要用到的。其实PGI编译器不仅仅可以支持Fortran，还可以支持C/C++。而对于集群用户来说，要将上万行的代码加速移植到GPU集群上，PG

07

【Rust日报】2020-04-20 软件开发者经济学：现在估计全球有60万活跃Rust程序员

受wired-logic启发，wired-logic-rs是一个基于像素的数字电路模拟器，核心技术采用Rust和WebAssembly

02

[Setting]win7下运行exe失败:应用程序无法启动，因为应用程序的并行配置不正确

因为他们是新装的系统，给他们装的是Win7 32bit的系统，其它什么都没安装，根据网上的说明，估计是两个问题。

03

CPU SIMD简介

之前的两篇文章，分别介绍了CPU和CPU Cache两个话题，性能是永恒的核心。我们也谈到了优化CPU性能面临的三堵墙：

03

听GPT 讲Rust源代码--compiler(22)

rust/compiler/rustc_target/src/spec/x86_64_unknown_netbsd.rs 文件是 Rust 编译器针对 x86_64-unknown-netbsd 目标平台的配置文件。该文件定义了与该平台相关的特性、链接选项、目标特定的运行时支持以及其他与该平台有关的属性。

01

[转]托管代码与非托管代码

托管代码是一microsoft的中间语言(IL)，他主要的作用是在.NET FRAMEWORK的公共语言运行库(CLR)执行代码前去编译源代码，也就是说托管代码充当着翻译的作用，源代码在运行时分为两个阶段： 1.源代码编译为托管代码,（所以源代码可以有很多种，如VB,C#,J#) 2.托管代码编译为microsoft的平台专用语言。

03

Doris开发手记2：用SIMD指令优化存储层的热点代码

最近在进行Doris的部分查询调优工作，通过perf定位CPU执行热点时，发现了以下的热点部分：

01

Doris开发手记2：用SIMD指令优化存储层的热点代码

最近在进行Doris的部分查询调优工作，通过perf定位CPU执行热点时，发现了以下的热点部分：

03

解决Your CPU supports instructions that this TensorFlow binary was not compiled to

这个错误表示你的CPU支持AVX和AVX2指令集，但是你所使用的TensorFlow二进制文件没有被编译以支持这些指令集。在这篇博客文章中，我们将介绍如何解决这个问题。

02

【Matlab】表情合成尝试（5）——68个特征点(landmarks)

上一篇【Matlab】表情合成尝试（4）——Dlib库混合编译中成功让应用了Dlib库的C++函数编译为了matlab的可用的Mex文件，又说到了Dlib库可以用来自动标定人脸的68个特征点(landmarks)。本篇便是要来具体编写接口来将Dlib的标记特征点函数应用到matlab过来。

02

NumPy 1.26 中文文档（五十四）

NumPy 1.26.0 发布是 1.25.x 发布周期的延续，增加了对 Python 3.12.0 的支持。Python 3.12 放弃了 distutils，因此支持它需要找到一个替代方案来替代 NumPy 使用的 setup.py/distutils 基于的构建系统。我们选择使用 Meson 构建系统，这是第一个支持它的 NumPy 版本。这也是第一个支持 Cython 3.0 的版本，同时保留了 0.29.X 的兼容性。支持这两个升级是一个大项目，在这个版本中有 100 多个文件被修改。更新日志没有完全记录工作的全部范围，特别感谢 Ralf Gommers、Sayed Adel、Stéfan van der Walt 和 Matti Picus 在主要开发分支中做了大部分工作。

01

一文看懂OpenCV 4.0 所有新特性

距离OpenCV 3.0发布已逾三年半了，终于在2018-11-20，OpenCV 4.0正式版强势来袭！至此开始OpenCV 4.x的王朝！

05

DPDK 21.08 hygon (海光) CPU 环境构建

海光(hygon) CPU 是基于 AMD Zen 1 (znver1)核心设计授权许可, AMD与国内合资研发的一款 x86_64 CPU. 支持 SSE/SSE2/SSE3/SSE4A/SSE4.1/SSE4.2/AVX/AVX2/RDRND/RDSEED/PCLMUL 指令集.

03

了解一下ARM CPU架构

最近有个需求：要求安装一个MySQL8.0在ARM架构上；CPU的ARM架构听说过，但没实际部署过；且这个ARMCPU架构又是一个什么东东，只是脑子有这么个名字，具体不是很了解。故今日集中学习下，有了此文。

01

2024 年，向量数据库的性能卷到什么程度了？

对于数据库（尤其是向量数据库）而言，“性能”是一个十分关键的指标，其用于衡量数据库是否能够在有限资源内，高效处理大量用户请求。对于向量数据库用户而言，尽管可能在某些情况下对延时的要求不高，但对性能指标的高要求却一如既往，从未改变。

01

算法卷不动了，最后一个值得卷的百万年薪赛道！

随着大数据的发展，计算机芯片算力的提升，人工智能近两年迎来了新一轮的爆发。而人工智能实现超级算力的核心就是AI芯片。AI芯片也被称为人工智能加速器，即专门用于处理人工智能应用中的大量计算任务的模块。 2020年我国人工智能芯片市场规模约为184亿元。未来5G商用的普及将继续催生人工智能芯片的应用需求，中国人工智能芯片行业将快速发展，预计2023年市场规模将突破千亿元。那么，如何借助AI芯片来实现特定的任务，将是所有AI芯片产业人员必备的技能。为此，贪心学院重磅推出《高性能神经网络与AI芯片应用研修课程》

03

算法卷不动了，2022年一个值得卷的蓝海赛道！

随着大数据的发展，计算机芯片算力的提升，人工智能近两年迎来了新一轮的爆发。而人工智能实现超级算力的核心就是AI芯片。AI芯片也被称为人工智能加速器，即专门用于处理人工智能应用中的大量计算任务的模块。 2020年我国人工智能芯片市场规模约为184亿元。未来5G商用的普及将继续催生人工智能芯片的应用需求，中国人工智能芯片行业将快速发展，预计2023年市场规模将突破千亿元。那么，如何借助AI芯片来实现特定的任务，将是所有AI芯片产业人员必备的技能。为此，贪心学院重磅推出《高性能神经网络与AI芯片应用研修课程》

03

FFMPEG 配置选项详细说明

使用以下任何一个开关将允许FFmpeg链接到相应的外部库。所有组件都依赖于该库如果所有其他依赖项都得到满足而未满足，则将启用明确禁用。例如。 –enable-libwavpack将启用链接 libwavpack并允许构建libwavpack编码器，除非它是使用–disable-encoder = libwavpack专门禁用。

03

PaddlePaddle踩坑指北系列——Linux安装（二）

本周我们在社区问答中精选出开发者在使用Linux安装时遇到的技术难题，可以到PaddlePaddle公众号【常见问答】专栏上寻求解决方案，更好的帮助新用户在安装过程中答疑解惑。

01

avx2指令集对php有用吗,AVX2指令集的作用[通俗易懂]

介绍AVX指令集之前，先要引入一个向量的概念。所谓向量，就是多个标量的组合，通常意味着SIMD(单指令多数据)，就是一个指令同时对多个数据进行处理，达到很大的吞吐量。早在1996年，Intel就在X86架构上应用了MMX(多媒体扩展)指令集，那时候还仅仅是64位向量。到了1999年，SSE(流式SIMD扩展)指令集出现了，这时候的向量提升到了128位。

03

JVM系列（一）—— 何为JVM

JVM能够跨计算机系结构来执行JAVA字节码，主要是由于JVM屏蔽了与各个计算机平台相关的软件或硬件之间的差异，使得与平台相关的耦合统一由JVM提供者来实现。

01

Java及JVM简介

懂得JVM内部的内存结构、工作机制，是设计高扩展性应用和诊断运行时问题的基础，也是Java工程师进阶的必备能力。

02

秒懂深入解析java虚拟机：C2编译器，机器无关优化有多牛？

IGVN每次从工作集获取一个节点，如果节点没有输出边，那么该节点是个死节点，可以安全移除。C2会递归式地移除死节点的输入边，这一步又可能产生新的死节点。如果节点有输出边，对该节点应用transform_old进行变形（transform_old调用节点的Ideal、Identity和GVN优化），如果节点变换成功，会将新节点加入工作集。如此反复，直到工作集没有节点，即没有节点可以再次优化。具体优化过程如代码清单9-20所示：

01

听GPT 讲Rust源代码--compiler(20)

rust/compiler/rustc_target/src/spec/armv7_unknown_linux_musleabihf.rs 文件是 Rust 编译器源代码中的一个特定平台规范文件，用于指定目标平台为 armv7-unknown-linux-musleabihf 的情况下的编译规格和特性。

01

PaddlePaddle踩坑指北系列——Linux安装（一）

本周我们在社区中精选出开发者在使用PaddlePaddle过程中遇到的技术难题，希望能帮助广大用户在Linux安装过程中解答疑惑。

02

Github 项目推荐 | 用 C++ 写成的机器学习和数据分析应用程序工具包 —— dlib

Dlib 是一个 C ++ 工具箱，其中包含用于在 C ++ 中创建复杂软件以解决实际问题的机器学习算法和工具。请参阅 http://dlib.net 获取项目文档和 API 参考。

03

.NET 8正式发布

11 月 15 日开始的为期三天的 .NET Conf 在线活动的开幕日上，.NET 8作为微软的开源跨平台开发平台正式发布。.NET 团队着重强调云、性能、全栈 Blazor、AI 和 .NET MAUI 是.NET 8的主要亮点。。NET团队在 .NET Conf 2023 [1]活动开幕式上表示：“通过这个版本，.NET 重塑了我们构建按需扩展的智能、云原生应用程序和高流量服务的方式。无论你是部署到 Linux 还是 Windows，使用容器还是你选择的云应用模型，.NET 8 都能更轻松地构建这些应用。”

04

AArch64 学习(一) 基础指令, 内存布局, 以及基础栈操作

ARM 是高级-RISC(精简指令集)-机器的缩写, 是精简指令集架构的家族. 同时 Arm Ltd. 也是开发和设计、授权这项技术的公司名称.

03

windows 下基于 WSL2安装DeepSpares进行YOLOV8 v5 的加速推理

可以通过查看CPU的规格或者使用特定的命令来检测CPU是否支持AVX2指令集。具体方法如下：

01

英特尔最新版 C/C++ 编译器采用 LLVM 架构，性能提升明显

下一代英特尔 C/C++ 编译器的表现会更加出色，因为它们将使用 LLVM 开源基础架构。

01

ARM与x86架构对比：从编程视角解析

ARM和x86是目前计算领域中最常见的两种微处理器架构。x86架构主要由Intel和AMD开发，广泛应用于个人计算机和服务器市场；而ARM架构则因其低功耗、高能效的特点，在移动设备和嵌入式系统中占据主导地位。随着技术的发展，ARM架构也在向高性能计算领域拓展，如苹果M1芯片的成功就是很好的例证。了解这两种架构的异同对于开发者来说至关重要，尤其是当面对跨平台编程任务时。

01

Spark向量化计算在美团生产环境的实践

Apache Spark是一个优秀的计算引擎，广泛应用于数据工程、机器学习等领域。向量化执行技术在不升级硬件的情况下，既可获得资源节省，又能加速作业执行。Gluten+Velox解决方案为Spark换上了向量化执行引擎，本文将阐述美团在这一方向的实践和思考。

01

go哈希

哈希查找表一般会存在“碰撞”的问题，就是说不同的 key 被哈希到了同一个 bucket。一般有两种应对方法：链表法和开放地址法。链表法将一个 bucket 实现成一个链表，落在同一个 bucket 中的 key 都会插入这个链表。开放地址法则是碰撞发生后，通过一定的规律，在数组的后面挑选“空位”，用来放置新的 key。

iOS逆向之ARM64汇编基础

我们知道，目前为止Apple的所有iOS设备都采用的是ARM处理器。ARM处理器的特点是体积小、低功耗、低成本、高性能，所以很多手机处理器都基于ARM，ARM在嵌入式系统中也具有广泛的应用。 ARM处理器的指令集对应的就是ARM指令集。armv6｜armv7｜armv7s｜arm64都是ARM处理器的指令集，这些指令集都是向下兼容的，例如arm64指令集兼容armv7，只是使用armv7的时候无法发挥出其性能，无法使用arm64的新特性，从而会导致程序执行效率没那么高。在iPhone5s及其之后的iOS设备指令集都是ARM64。还有两个我们也很熟悉的指令集：i386和x86_64是Mac处理器的指令集，i386是针对intel通用微处理器32架构的。x86_64是针对x86架构的64位处理器。所以当使用iOS模拟器的时候会遇到i386｜x86_64，因为iOS模拟器没有ARM指令集。

03

跟Google学写代码--Chromium/base--cpu源码学习及应用

Chromium是一个伟大的、庞大的开源工程，很多值得我们学习的地方。前面写道：《跟Google学写代码–Chromium/base–stl_util源码学习及应用》《跟Google学写代码–Chromium/base–windows_version源码学习及应用》今天分享cpu相关的操作。先看看这个枚举： enum IntelMicroArchitecture { PENTIUM, SSE, SSE2, SSE3, SSSE3, SSE41

07

Milvus 2.0 Knowhere 概览

如果把 Milvus 比喻为一辆跑车，Knowhere 就是这辆跑车的引擎。Knowhere 的定义范畴分为狭义和广义两种。狭义上的 Knowhere 是下层向量查询库（如Faiss、HNSW、Annoy）和上层服务调度之间的操作接口。同时，异构计算也由 Knowhere 这一层来控制，用于管理索引的构建和查询操作在何种硬件上执行，如 CPU 或 GPU，未来还可以支持 DPU/TPU/……这也是 Knowhere 这一命名的源起 —— know where。广义上的 Knowhere 还包括 Faiss 及其它所有第三方索引库。因此，可以将 Knowhere 理解为 Milvus 的核心运算引擎。

01

算法卷不动了，最后一个值得卷的百万年薪赛道！

众所周知，深度神经网络模型被广泛应用在图像分类、物体检测，目标跟踪等计算机视觉任务中，并取得了巨大成功。随着不同场景的需求变得更加多样，越来越多的IoT设备和场景需要与数据采集点以最接近的低时延来进行决策和操作；另外IoT物联设备生成的数据量通常很大，由于运营成本、时间和隐私方面的考虑，移动和存储所有生成的数据不太可行。 AI技术的一个趋势是在设备端上部署高性能的神经网络模型，并在真实场景中实时运行。如移动端/嵌入式设备，这些设备的特点是内存资源少，处理器性能不高，功耗受限，这使得目前精度最高的模型根本

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭