linux 浮点运算性能_linux浮点运算_linux 浮点运算 - 腾讯云开发者社区

、、

一些用C语言编写的程序在pc linux机器上进行了大量的浮点运算，得到了正确的结果，但在单元处理器的SPE上得到了错误的结果，但在单元的PPU上却得不到。我用的是gcc编译器。我想知道是否有一些gcc编译选项，以增加四舍五入的方法或类似的，所以我得到更精确的单浮点精度计算。我不能改成双倍，因为对SPE的性能会大幅降低谢谢

浏览 7提问于2010-09-23得票数 3

回答已采纳

2回答

iPhone 4和iPad 2:定点运算相对于浮点运算的优势

、、、、

我听说iPhone 4和iPad有一个叫做VFP的浮点运算单元，它在某种程度上优化了浮点运算，甚至允许使用单指令多路复用(尽管GCC是否利用了这一点还是个疑问)。然而，我读到对于一些Android设备，使用定点而不是浮点的加速可以导致性能提高20倍。在这些设备中使用定点运算而不是浮点来实现浮点密集型代码有什么好处？

浏览 2提问于2011-04-01得票数 1

回答已采纳

1回答

估计CPU的性能

、、

所以就是这样， “对于整数运算，a+b和a*b需要几乎相同的时间，对于浮点(32位)乘法，它需要大约3倍的时间。浮点加法和整数加法需要几乎相同的时间。对于一个20%的逻辑运算(无论如何都需要相同的时间)，40%的加法运算和40%的乘法运算的程序，展示了如何计算在同一个CPU上将数学从整数运算转换为浮点运算的估计性能。”我应该使用/采取哪些步骤/公式来计算估计的性能？我并不是想要一

浏览 2提问于2016-12-16得票数 0

1回答

CUDA中整数浮点数的“安全”算法

我目前正在研究在CUDA上使用浮点数而不是整数进行算术运算。由于整数运算与浮点运算相比非常慢，因此当使用浮点数而不是整数时可能存在性能增强，因此出现了必要性。我做了一个小实验，并写了一个简单的程序，只是循环和增加1.0f的variable..It出来，这工作到16777216.0f的..adding进一步1.0f的数字将保持不变…所以我想知道这个数字是不是运算符

浏览 2提问于2012-11-01得票数 0

1回答

所有失败的操作包括什么？

、、

FLOPS代表每秒的浮点运算，我知道浮点是什么。我想知道这些操作是什么？+, -, *, /是唯一的运算还是像取对数()、指数()这样的运算也是FLO？我不是一个计算机科学的人，所以请尽量少些技术。如果我完全理解错了，请告诉我。谢谢

浏览 1提问于2015-04-03得票数 2

回答已采纳

1回答

支持m7双精度浮点处理器的扩展内联汇编器

、

针对Cortex M4和M7微处理器的单精度浮点运算单元代码，GCC系列程序提供了扩展的内联汇编器约束，因此编写浮点运算单元性能检查代码是很简单的。

浏览 18提问于2021-07-31得票数 0

回答已采纳

1回答

处理设备驱动程序中的浮点值

、、、

我正在写sysfs相关的Linux设备驱动程序代码。我对如何处理变量上的浮点运算感到困惑。有没有什么函数可以用来处理浮点操作，或者有谁知道在Linux内核设备驱动程序中处理浮点操作的最好方法？代码： volts *= 250;我想在内核部分处理这样的操作，浮点值应该是准确的。

浏览 19提问于2021-07-16得票数 0

1回答

Linux中浮点的性能

、、

我已经为我的电脑测试了视窗和Linux的Geekbench。看来Linux在浮点性能上明显下降。我能做些什么吗？安装优化库？换个环境？浮点算法的差异如何解释？

浏览 0提问于2013-09-24得票数 0

回答已采纳

3回答

因此，性能很重要。现在，我看到了许多紧凑的循环，每个循环占执行时间的很大一部分:没有单一的瓶颈。这些循环中的大多数都做了一些浮点运算，但它们之间有很多分支。浮点运算主要限于加法、减法、乘法、除法和比较。所有这些都是使用32位浮点数完成的。我的目标平台是至少包含SSE1指令的x86。(我已经在汇编程序输出中验证了编译器确实生成了SSE指令。)我使用的大多数浮点值都有一个相当小的上限，接近零值的精度并不是很重要。所以我突然想到:也许改用定点运算可以加快速

浏览 0提问于2010-04-19得票数 12

回答已采纳

2回答

运行在Windows和Linux/Ubuntu上的Benchmark测试软件

、、、

我想知道是否有可以下载的基准测试软件，可以在Windows (最好是Windows 7)和Linux (Ubuntu 9.10)上运行？Passmark性能测试只在Windows下运行。

浏览 0提问于2010-03-11得票数 3

回答已采纳

1回答

使用浮点操作对整数数据旋转正确操作？

、、

我想用一个无符号整数表示的值，并以某种方式，使用浮点操作，执行一个旋转右移位位操作。看看这里使用的聪明： --它使用一个神奇的值和一些技巧来使用整数操作对浮点数执行操作。我想要的正好相反；我使用的硬件对浮点进行了很大的优化，但是对整数操作的性能很差。该算法采用sha256算法，充分利用了旋转权运算。

浏览 2提问于2011-05-09得票数 2

6回答

Android上常见的性能陷阱？

、、、、

什么是最容易犯的错误，可能是Android的性能下沉？为了便于讨论，让我们假设它在G1/类似设备上运行。

浏览 4提问于2009-10-01得票数 5

回答已采纳

6回答

Invert 4x4矩阵-所需的数值最稳定解

、、、、

使用浮点运算时，我通常只需构建伴随矩阵并除以行列式(例如，暴力破解)。到目前为止，这对我来说是有效的，但当处理定点数字时，由于使用了所有乘法，我得到了不可接受的精度损失。注意:在定点运算中，我总是丢弃直接结果的一些最低有效位。那么，求逆矩阵的最稳定的数值方法是什么？我不太在意性能，但简单地使用浮点将会减慢我的目标架构。

浏览 1提问于2008-10-01得票数 13

回答已采纳

7回答

这些天什么时候使用固定点

、、、、

对于密集的数字运算，我考虑使用定点而不是浮点。当然，固定点类型的大小是多少字节，它将在什么CPU上运行，如果我可以使用(对于Intel) MMX或SSE或任何新出现的东西，这都是很重要的。我在想，如果现在浮点运算的速度比以往任何时候都快，那么是否值得考虑定点？有没有一般的经验法则，我们可以说它会比几个百分点更重要？从35,000英尺的数值性能来看，情况如何？

浏览 0提问于2008-10-05得票数 23

回答已采纳

4回答

为什么我可以在Linux内核模块中执行浮点操作？

、、、、

作为实验，我将以下函数编译成一个基本的字符驱动程序模块，以了解Linux内核对浮点操作的反应。这似乎很奇怪；我以为您不能在Linux内核中执行浮点操作--除了一些例外，比如kernel_fpu_begin()。模块是如何执行浮点运算的？这是因为我使用的是x86处理器吗？

浏览 0提问于2013-04-09得票数 17

回答已采纳

1回答

C++0x优化编译器质量

、、、、

我做了一些繁重的数字运算，对我来说浮点运算的性能非常重要。我非常喜欢英特尔编译器的性能，并对它产生的汇编质量相当满意。性能是否可与C++相媲美？有什么基准吗？谢谢。 ps:在某种程度上，我会亲自测试它，但我想知道相对于C++会有什么期待。

浏览 0提问于2010-04-21得票数 12

回答已采纳

10回答

单精度浮点运算和双精度浮点运算有什么区别？

、、、

单精度浮点运算和双精度浮点运算有什么区别？我特别感兴趣的是与视频游戏机相关的实用术语。例如，任天堂64是否有64位处理器，如果有，这是否意味着它能够进行双精度浮点运算？PS3和Xbox360可以实现双精度浮点运算，还是只能实现单精度浮点运算，并且通常使用双精度功能(如果它们存在的话？)。

浏览 3提问于2009-04-29得票数 186

回答已采纳

1回答

确定ASM程序的FLOPS

、、、、

现在我们已经实现了所有这些算法，我们想知道与通常的矩阵乘法相比，它们的性能有多高。我们已经实现了代码来测量所有这些算法的运行时间，但现在我们决定还要知道我们可以执行多少次每秒的浮点运算(FLOPS)。architecture: 7CPU part : 0xc08我们的第一个想法是现在实现一种FPO计数器，我们在每次浮点操作(算术操作以及比较和移动操作)后递增，但这意味着我们必须在代码中插入递增操作，这也会减慢应用程序...有没有人知道有没

浏览 3提问于2015-01-26得票数 10

1回答

用于浮点行为的C++调试器或取消链接器

、、

我的程序使用了一些浮点运算。在我自己的工作站上，它按预期工作，但在另一台机器上，它出现了奇怪的浮点错误。这两台机器在Linux上都使用了gcc 4.4.3，所有对象的编译器行都是是否有调试器或代码检查器("unlinter")专门用于在运行时检测可能的意外浮点<

浏览 1提问于2011-05-26得票数 0

1回答

如何将432位浮点数存储到128位xmm寄存器中？

、、、、

我想将432位浮点数存储到xmm0中，其中每个浮点数都存储在一个128位寄存器中。例如，我有4个浮点数: xmm1: 10.2 xmm2: 5.8 xmm3: 9.3 xmm4: 12.7 (每个浮点数仅使用128位寄存器的32位)，并希望将它们存储到xmm0中: 10.2、5.8、然后，在对xmm0做了一些数学运算之后，我还想分别提取它们(例如，覆盖..) 我试过使用movlps和movhps，但它们只使用内存来加载，而不使用128位寄存器作为源。由于性能原因，我不想使用任何额外的内存

浏览 0提问于2019-07-05得票数 4

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

有没有可能用gcc提高浮点运算的精度？

iPhone 4和iPad 2:定点运算相对于浮点运算的优势

估计CPU的性能

CUDA中整数浮点数的“安全”算法

所有失败的操作包括什么？

支持m7双精度浮点处理器的扩展内联汇编器

处理设备驱动程序中的浮点值

Linux中浮点的性能

定点运算值得我费心吗？

运行在Windows和Linux/Ubuntu上的Benchmark测试软件

使用浮点操作对整数数据旋转正确操作？

Android上常见的性能陷阱？

Invert 4x4矩阵-所需的数值最稳定解

这些天什么时候使用固定点

为什么我可以在Linux内核模块中执行浮点操作？

C++0x优化编译器质量

单精度浮点运算和双精度浮点运算有什么区别？

确定ASM程序的FLOPS

用于浮点行为的C++调试器或取消链接器

如何将432位浮点数存储到128位xmm寄存器中？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐