有没有办法用gcc自动生成MMX指令(而不是SSE指令

gcc是一种开源的编译器套件，用于编译C、C++和其他编程语言的源代码。它提供了丰富的编译选项和优化功能，可以生成针对不同处理器架构的指令集。

MMX（MultiMedia eXtensions）是Intel推出的一种多媒体指令集，用于加速多媒体数据的处理。MMX指令集主要用于处理像素、音频和视频等多媒体数据，提供了一些特殊的指令和寄存器，可以并行处理多个数据。

在gcc中，可以使用特定的编译选项来生成针对MMX指令集的代码。通过使用"-march"和"-mcpu"选项，可以指定目标处理器架构和CPU型号，以便gcc生成相应的指令集代码。例如，对于支持MMX指令集的Intel处理器，可以使用以下编译选项：

gcc -march=pentium -mmmx -o output input.c

上述命令中，"-march=pentium"指定目标处理器架构为Pentium系列，"-mmmx"指定使用MMX指令集。然后，将输入源文件"input.c"编译为可执行文件"output"。

需要注意的是，MMX指令集已经过时，现代的处理器更倾向于使用SSE（Streaming SIMD Extensions）指令集来进行多媒体数据的处理。SSE指令集提供了更多的功能和性能优化。因此，在实际开发中，建议使用SSE指令集来代替MMX指令集。

对于云计算领域，如果需要进行多媒体数据处理，可以考虑使用腾讯云的云服务器（CVM）产品。腾讯云的云服务器提供了多种配置和规格的虚拟机实例，可以满足不同应用场景的需求。您可以通过以下链接了解更多关于腾讯云云服务器的信息：

腾讯云云服务器产品介绍：https://cloud.tencent.com/product/cvm

总结：通过gcc编译器的特定选项，可以生成针对MMX指令集的代码。然而，由于MMX指令集已经过时，建议在实际开发中使用更先进的SSE指令集。对于云计算领域的多媒体数据处理需求，可以考虑使用腾讯云的云服务器产品。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

Doris开发手记2：用SIMD指令优化存储层的热点代码

而实际数据Page之中存储的不是原始的字符串了，而是偏移量了。而实际解码的时候，则需要分配内存，并从字典之中将对应偏移量的内存拷贝出来。这就是上面代码热点产生的地方。...当代的X86处理器通常都支持了MMX，SSE，AVX等SIMD指令，通过这样的方式来加快了CPU的计算。当然SIMD指令也是有一定代价的，从上面的图中也能看出端倪。...2.2 如何生成SIMD指令通常生成SIMD指令的方式通常有两种： Auto Vectorized 自动向量化，也就是编译器自动去分析for循环是否能够向量化。...如果可以的话，便自动生成向量化的代码，通常我们开始的-O3优化便会开启自动向量化。...比如实现的AVX的向量化算法并不能在不支持AVX指令集的机器上运行，也无法用SSE指令集代替。 3.开发起来，解决问题通过上一小节对SIMD指令的分析。

1.3K1 1

浅析Clickhouse的向量化执行

关于Clickhouse之所以会像闪电一样快，是多方面的优化，包过但不仅限于：高效且磁盘友好的列式存储，高效的数据压缩，精心设计的各类索引，并行分布式查询，运行时代码生成等。...为了制作n杯果汁，非向量化执行的方式是用1台榨汁机重复循环制作n次，而向量化执行的方式是用n台榨汁机只执行1次。为了实现向量化执行，需要利用CPU的SIMD指令。...Intel的第一版SIMD扩展指令集称为MMX，于1997年发布。...ClickHouse的向量化执行机制主要依赖于SSE指令集，下面简要介绍之。 SSE指令集 SSE指令集是MMX的继任者，其第一版早在Pentium III时代就被引入了。...Intel将这类指令和函数统称为intrinsics，官方提供的速查手册见这里；开启编译器的优化（-msse、-msse2等等），编译器会自动将符合条件的情景（如数组相加、矩阵相乘等）编译为intrinsic

6152 0

Doris开发手记2：用SIMD指令优化存储层的热点代码

1.2K3 0

Qt-4.8.7交叉编译平台的搭建、移植详解( aarch32、aarch64 、mips64)「建议收藏」

指令集找不到，因此需要在执行配置时指定编译的架构，即添加：-DQT_ARCH_ARM。...截图如下：然后进入lib目录，使用file *命令查看生成的动态库类型，如果显示为下图，则表示生成aarch32架构的qmake以及qt库成功。...指令集找不到，因此需要在执行配置时指定编译的架构，即添加：-arch generic。...然后进入lib目录，使用file *命令查看生成的动态库类型，如果显示为下图，则表示生成aarch64架构的qmake以及qt库成功。...然后进入lib目录，使用file *命令查看生成的动态库类型，如果显示为下图，则表示生成mips64el架构的qmake以及qt库成功。

9.4K2 1

DPDK 21.08 hygon (海光) CPU 环境构建

支持 SSE/SSE2/SSE3/SSE4A/SSE4.1/SSE4.2/AVX/AVX2/RDRND/RDSEED/PCLMUL 指令集....GCC GCC 6.3+ 可指定微架构 -march=znver1 优化 hygon 代码: $ gcc -march=znver1 -E -dM - SSE\|_RD\|_PCLMUL" #define __SSE4_1__ 1 #define __SSE4_2__ 1 #define __MMX_WITH_SSE__ 1 #define __...tar.xz wget http://fast.dpdk.org/rel/dpdk-21.08.tar.xz 需要注意点： dpdk-21.08 meson build 不再使用 -Dmachine 设定优化指令集参数..., 现已变更为 -Dcpu_instruction_set; dpdk-21.08 默认通过检查编译器是否支持AVX512添加 AVX512 的支持, 而hygon不支持AVX512指令集, dpdk

1.6K3 0

这篇文章不知道起什么名字

我这个文章不知道起什么名字,我就是在课堂上面搭建的了一个GCC的环境 help命令展示所有的帮助文件打印所有平台的编译信息 gcc版本对文件进行头文件展开 -E是展开头文件的编译开关这个开关是生成汇编语言...-nostdlib：不链接系统标准启动文件和标准库文件，只把指定的文件传递给链接器 -W：打印一些额外的警告信息 -w：禁止显示所有警告信息 -msse/-msse2/mmx/mno-sse/mno-sse2.../mno-mmx：使用或者不使用MMX、SSE、SSE2指令 -m32/-m64：生成32位/64位机器上的代码 -mpush-args/mon-push-args：（不）使用push指令来进行存储参数...创建并使用静态链接库方法编写C源文件，设为static_lib.c，其中写入需要重复调用的函数，然后使用命令gcc -c static_lib.c生成目标文件static_lib.o 使用ar工具创建静态库.../static_lib.a -o app编译生成可执行文件app 创建并使用动态库方法编写C源文件share_lib.c，写入需要重复调用的函数，然后使用命令gcc -shared -FPIC -o

7403 0

i386和i686的具体定义

alpha、PowerPC、Sun等各个不同版本，所有从Intel386-P4都用i386版本，但i386版本中有几个内核（i486,i486,i586,i686)，安装时安装程序检测到你得CPU级别后，自动为你安装相应内核...而软件包为了能发挥好cpu的全部性能，就加入cpu相对应能指行的指令。因此就产生了各种不同的软件包。所以，i686的软件包能在奔腾二代以上的cpu上执行，但基本不能在此之先的cpu如486上执行。...i686是pentiumpro及以后的通用arch，而i386是所有x86的通用arch，i386包括而i686没有包括的就是386、486、586(pentium)、pentium－mmx 现在应该没有人还在用...pentium2: MMX pentium3(m): MMX SSE pentium-m: MMX SSE SSE2...pentium4(m): MMX SSE SSE2 prescott: MMX SSE SSE2 SSE3

1.3K6 0

上古遗民-英特尔® Galileo

它比较像是改良了制程，但阉割了 MMX 指令集的奔腾 I 代处理器....从支持的指令集看，Quark 并不像其他 Atom 芯片那样支持 x64、MMX、SSE 等高级的指令集，但包含了浮点指令集(x87)。...虽然 Intel 的官方参数中提到 Quark 的指令集是与奔腾兼容的，但很明显，由于缺少了 MMX 指令这个作为奔腾处理器的重要标志，实际上很多可以在奔腾 I CPU上运行的程序在 Quark 上可能是不能运行的...这点算是一个遗憾，缺少 MMX、SSE 这类 SIMD 的指令集加速，使得 Quark 在处理多媒体、图像运算、计算机视觉等算法上可能会表现的较差。...因此现在的程序只要不带有 MMX、SSE 指令，理论上是可以在 Quark 上运行的很好的。在功耗方面，Quark 将 max TDP 控制在 2.2W。

5942 0

各种开源汇编、反汇编引擎的非专业比较

指令集支持不全，由于Ollydbg年久失修，现在甚至连对MMX指令集都不全，而现在的INTEL/AMD的扩展指令集标准又更新了多个版本，什么SSE5/AVX/AES/XOP就更别提了，完全无法解析。...目前实现的扩展指令集有： FPU, MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2, VMX, CLMUL, AES, MPX 　　同时它也给不同种类的指令进行了分类...udis86支持的X86扩展指令集有： MMX, FPU (x87), AMD 3DNow, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2, AES, AMD-V,...avx512f, avx512pf, bmi, bmi2, fma, fma4, fsgsbase, lzcnt, mmx, sha, slm, sse, sse2, sse3, sse4.1, sse4.2...，但是又各自有那么一丁点儿的缺陷，这世上没有完美的事情，人家都开源了，有的用就不错了，自己总要做些事情不是？

3.5K3 0

i386i686x86-64的区别

alpha、PowerPC、Sun等各个不同版本，所有从Intel386-P4都用i386版本，但i386版本中有几个内核（i486,i486,i586,i686)，安装时安装程序检测到你得CPU级别后，自动为你安装相应内核...而软件包为了能发挥好cpu的全部性能，就加入cpu相对应能指行的指令。因此就产生了各种不同的软件包。所以，i686的软件包能在奔腾二代以上的cpu上执行，但基本不能在此之先的cpu如486上执行。...i686是pentiumpro及以后的通用arch，而i386是所有x86的通用arch，i386包括而i686没有包括的就是386、486、586(pentium)、pentium－mmx 现在应该没有人还在用...而rpm都是为i386打的包，运行效率会低很多。兼容性关系大概是 i386: i386: i486: winchip-c6: MMX 3dNOW!...: MMX SSE SSE2 pentium4(m): MMX SSE SSE2 prescott: MMX SSE SSE2 SSE3 nocona: MMX SSE SSE2 SSE3 （64bit

4.9K1 0

i386和i686的区别

alpha、PowerPC、Sun等各个不同版本，所有从Intel386-P4都用i386版本，但i386版本中有几个内核（i486,i486,i586,i686)，安装时安装程序检测到你得CPU级别后，自动为你安装相应内核...而软件包为了能发挥好cpu的全部性能，就加入cpu相对应能指行的指令。因此就产生了各种不同的软件包。所以，i686的软件包能在奔腾二代以上的cpu上执行，但基本不能在此之先的cpu如486上执行。...i686是pentiumpro及以后的通用arch，而i386是所有x86的通用arch，i386包括而i686没有包括的就是386、486、586(pentium)、pentium－mmx 现在应该没有人还在用...而rpm都是为i386打的包，运行效率会低很多。兼容性关系大概是 i386: i386: i486: winchip-c6: MMX 3dNOW!...: MMX SSE SSE2 pentium4(m): MMX SSE SSE2 prescott: MMX SSE SSE2 SSE3 nocona: MMX SSE SSE2 SSE3 （64bit

1.8K2 0

vc2010 sse指令优化效果明显

对于大量浮点数运算，用sse指令优化的效果是非常明显的。...vs2010的编译器内置函数([Compiler Intrinsics])支持see指令,所以程序员不必痛苦的用汇编指令来实现sse指令优化,关于详细的sse指令说明参见microsoft的官方文档...Streaming SIMD Extensions (SSE)(点击打开链接) 下面这段代码用简单的循环实现两个浮点数组的点积之和，用sse指令重写之后效率相差4倍多。...其实道理也很简单，每条sse指令可以实现128位数的运算,对float型数据，就是4组float同时运算，循环次数减少4倍，效率自然也能提高4倍。...也可以通过程序检测cpu是否支持sse，参见 C++环境测试CPU是否支持MMX，SSE等(点击打开链接) gcc编译也支持sse，调用方法也差不多，还在实现中。

3682 0

Xmake v2.8.2 发布，官方包仓库数量突破 1k

我们可以配置 soname 的版本后缀名称，xmake 会在编译、安装动态库的时候，自动生成符号链接，执行指定版本的动态库。...，目前支持以下几种扩展指令集： add_vectorexts("mmx") add_vectorexts("neon") add_vectorexts("avx", "avx2", "avx512")...add_vectorexts("sse", "sse2", "sse3", "ssse3", "sse4.2") 其中，avx512, sse4.2 是我们新版本新增的指令配置，另外我们还新增了一个...另外，它的搜索路径也是需要通过 add_includedirs 来控制，而不是直接配置文件路径。...这些被添加文件不是代码文件，不会参与编译，也不会被安装，仅仅只是能够让用户方便的在生成的工程 IDE 中，快速编辑访问它们。将来，我们也可能用此接口做更多其他的事情。

2841 0

Linux系统中使用GCC CPU参数优化代码编译

Linux系统中使用GCC CPU参数优化代码编译使用特定的GCC参数可以使编译出的程序执行效率有较大提升。...具体如下： 1、优化原理：在编译程序时，借助参数传递的方法，使用与系统CPU相匹配的gcc参数，编译出的程序就是为系统CPU而进行特定优化过的，因而执行速度和效率都会是最好。...(2) 对于Gentoo Linux或FreeBSD可以通过修改/etc/make.conf添加参数的方法来实现，而不必使用参数传递法。...下面对其中的一些参数进行具体说明： -O3：相对于-O、-O1、-O2，-O3开启了所有GCC支持的优化特性； -msse2：开启CPU所支持的sse2指令集； -mmmx：参考-msse2 -mfpmath...=sse：为指定指令集生成浮点运算特性（优化浮点运算功能）； -mcpu：指定CPU型号； -march：指定CPU型号，基本同-mcpu，GCC根据-march设定的CPU型号决定在生成代码时可以使用哪些种类的指令

2.4K1 0

g++入门教程

使用-S选项，只进行编译而不进行汇编，生成汇编代码。 g++ -S test.i -o test.s //生成汇编.s文件（3）汇编（Assembly）。...-fno-strict-prototype 只对g++起作用,使用这个选项,g++将对不带参数的函数,都认为是没有显式的对参数的个数和类型说明,而不是没有参数.而gcc无论是否使用这个参数,都将对没有带参数的函数...-m32 -m64 生成32bits程序或64bits程序 -mmmx -msse -msse2 -mno-mmx -mno-sse -mno-sse2 使用或者不使用MMX，SSE，SSE2指令。...-M 生成文件依赖的信息，包含目标文件所依赖的所有源文件。你可以用gcc -M hello.c来测试一下，很简单。...例子用法: gcc -x c hello.pig -x none filename 关掉上一个选项，也就是让gcc根据文件名后缀，自动识别文件类型，例子用法: gcc -x c hello.pig

14.8K7 8

《游戏引擎架构》阅读笔记第一部分第4章

把多个8/16/32位整数载入特设的64位MMX寄存器后，MMX指令就能对那些寄存器进行SIMD运算。...英特尔陆续加入多个版本的扩展指令集，称为单指令数据流扩展(streaming SIMD extensions，SSE)，其中第一个SSE版本出现于奔腾III处器。...SSE指令采用128位寄存器，可储存整数或IEEE浮点数。游戏引擎中最常用的SSE模式为32位浮点数打包模式(packed 32-bit floating-pointmode)。...（P173） SSE寄存器（P173） _m128数据类型：此数据类型可以声明全局变量、自动变量和类或结构体的成员变量。...（P180 2）梅森旋转算法：有庞大周期（4.3×10^6001）,高阶的均匀分布维度，生成快速。

3681 0

armeabi-v7a架构(sv7a)

‘armeabi-v7a’ – 创建支持基于 ARM* v7 的设备的库，并将使用硬件 FPU 指令。‘x86’ – 生成的二进制代码可支持包含基于硬件的浮点运算的 IA-32 指令集。...SSE：英特尔推出的类似 NEON 的工具SSE 指面向英特尔架构(IA)的SIMD 流指令扩展。目前，英特尔® 凌动™ 最高支持 SSSE3（补充 SIMD 流指令扩展 3）。...凌动™ 暂不支持 SSE4.x。后者也是一个 128 位引擎，用于打包浮点数据。这一执行模式开始于 MMX 技术。SSx 是较新的技术，取代了 MMX。。...目前，SSE 概述部分在 5.5 节。它提供 SSE、SSE2、SSE3 和 SSSE3 的操作码。...XMM 寄存器主要用于取代 MMX 寄存器。

1.3K1 0

CPU SIMD简介

1996年，Intel针对X86指令集，推出了MMX扩展，这是第一次在商用硬件上支持SIMD技术，1999年，Intel在P3中推出了SSE(Streaming SIMD Extensions)，基于128...当然，你也可以用SSE指令_mm_set_ps1对result_sum4初始化。...结论是，加减乘除大概相当，指数会有较大提高，我查看了Release下对应的汇编，发现编译器对这类简单的for循环，会自动编译为SSE指令，因此，对这类代码，我们并不需要改造，而且我们的改造不见得比编译器写的好...最后，我要说的是，虽然学习SSE并不难，但在实践中还有很多综合应用，并且后续可能会有新增的指令集，不同CPU之间的兼容问题，所以，不建议自己写，而是用一些专业的第三方库。...我们的重点不是写一套自己的SSE/AVX库。要点4：专业的人做专业的事。

2.4K3 0

x86 CPU与IA-32架构

也就是说配置有387的机器与没有配置387的机器支持的指令是不同的。所添加的其他重要的指令还有 MMX和SSE(Streaming SIMD Extensions) 。...两者都是为了支持并行处理多条数据的扩展指令。例如用通常的IA-32指令进行加法运算时一次只能执行一次加法运算，但使用MMX和SSE的加法指令可以同时执行多个运算。...MMX寄存器 (MMX register) 是MMX指令用的寄存器。MMX Pentium以及Pentiunm Ⅱ之后的CPU中有从mm0到mm7共8个64位的寄存器。...但实际上MMX寄存器和浮点数寄存器是共用的，即无法同时使用浮点数寄存器和MMX寄存器。 XMM寄存器 (XMM register) 是SSE指令指令用的寄存器。...XMM寄存器和MMX寄存器不同，是独立的寄存器不和浮点数寄存器共用。另外 mxcsr寄存器是表示SSE指令的运算状态的寄存器。

1411 0

【向量检索研究系列】本地向量检索（上）

在微处理器中，单指令流多数据流技术则是一个控制器控制多个平行的处理微元，例如Intel的MMX或SSE以及AMD的3D Now!技术。目前Intel处理器支持的SIMD技术包括MMX,SSE,AVX....，MMX提供了8个64bit的寄存器进行SIMD操作，SSE系列提供了128bit的8个寄存器进行SIMD指令操作，AVX指令则支持256bit的SIMD操作。...目前SIMD指令可以有四种方法进行使用分别是汇编语言，C++类，编译器Intrisincs和自动矢量化。...#include //MMX __m64 定义#include //SSE(include mmintrin.h) __m128 定义#...lscpu // 查看flags标志中支持的所有指令集gcc -mavx2 -dM -E - < /dev/null|egrep AVX // 查看是否支持AVXgcc -msse4 -dM -E -

1.2K3 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

有没有办法用gcc自动生成MMX指令(而不是SSE指令

相关·内容

Doris开发手记2：用SIMD指令优化存储层的热点代码

浅析Clickhouse的向量化执行

Doris开发手记2：用SIMD指令优化存储层的热点代码

Qt-4.8.7交叉编译平台的搭建、移植详解( aarch32、aarch64 、mips64)「建议收藏」

DPDK 21.08 hygon (海光) CPU 环境构建

这篇文章不知道起什么名字

i386和i686的具体定义

上古遗民-英特尔® Galileo

各种开源汇编、反汇编引擎的非专业比较

i386i686x86-64的区别

i386和i686的区别

vc2010 sse指令优化效果明显

Xmake v2.8.2 发布，官方包仓库数量突破 1k

Linux系统中使用GCC CPU参数优化代码编译

g++入门教程

《游戏引擎架构》阅读笔记第一部分第4章

armeabi-v7a架构(sv7a)

CPU SIMD简介

x86 CPU与IA-32架构

【向量检索研究系列】本地向量检索（上）

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐