腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
有没有可能用gcc提高
浮点
运算
的精度?
c
、
floating-accuracy
、
spu
一些用C语言编写的程序在pc
linux
机器上进行了大量的
浮点
运算
,得到了正确的结果,但在单元处理器的SPE上得到了错误的结果,但在单元的PPU上却得不到。我用的是gcc编译器。我想知道是否有一些gcc编译选项,以增加四舍五入的方法或类似的,所以我得到更精确的单
浮点
精度计算。我不能改成双倍,因为对SPE的
性能
会大幅降低 谢谢
浏览 7
提问于2010-09-23
得票数 3
回答已采纳
2
回答
iPhone 4和iPad 2:定点
运算
相对于
浮点
运算
的优势
iphone
、
android
、
ipad
、
floating-point
、
fpu
我听说iPhone 4和iPad有一个叫做VFP的
浮点
运算
单元,它在某种程度上优化了
浮点
运算
,甚至允许使用单指令多路复用(尽管GCC是否利用了这一点还是个疑问)。然而,我读到对于一些Android设备,使用定点而不是
浮点
的加速可以导致
性能
提高20倍。 在这些设备中使用定点
运算
而不是
浮点
来实现
浮点
密集型代码有什么好处?
浏览 2
提问于2011-04-01
得票数 1
回答已采纳
1
回答
估计CPU的
性能
performance
、
cpu
、
computer-science
所以就是这样, “对于整数
运算
,a+b和a*b需要几乎相同的时间,对于
浮点
(32位)乘法,它需要大约3倍的时间。
浮点
加法和整数加法需要几乎相同的时间。对于一个20%的逻辑
运算
(无论如何都需要相同的时间),40%的加法
运算
和40%的乘法
运算
的程序,展示了如何计算在同一个CPU上将数学从整数
运算
转换为
浮点
运算
的估计
性能
。”我应该使用/采取哪些步骤/公式来计算估计的
性能
?我并不是想要一
浏览 2
提问于2016-12-16
得票数 0
1
回答
CUDA中整数
浮点
数的“安全”算法
cuda
我目前正在研究在CUDA上使用
浮点
数而不是整数进行算术
运算
。由于整数
运算
与
浮点
运算
相比非常慢,因此当使用
浮点
数而不是整数时可能存在
性能
增强,因此出现了必要性。我做了一个小实验,并写了一个简单的程序,只是循环和增加1.0f的variable..It出来,这工作到16777216.0f的..adding进一步1.0f的数字将保持不变…所以我想知道这个数字是不是
运算
符
浏览 2
提问于2012-11-01
得票数 0
1
回答
所有失败的操作包括什么?
performance
、
hpc
、
flops
FLOPS代表每秒的
浮点
运算
,我知道
浮点
是什么。我想知道这些操作是什么?+, -, *, /是唯一的
运算
还是像取对数()、指数()这样的
运算
也是FLO?我不是一个计算机科学的人,所以请尽量少些技术。如果我完全理解错了,请告诉我。 谢谢
浏览 1
提问于2015-04-03
得票数 2
回答已采纳
1
回答
支持m7双精度
浮点
处理器的扩展内联汇编器
stm32
、
stm32cubeide
针对Cortex M4和M7微处理器的单精度
浮点
运算
单元代码,GCC系列程序提供了扩展的内联汇编器约束,因此编写
浮点
运算
单元
性能
检查代码是很简单的。
浏览 18
提问于2021-07-31
得票数 0
回答已采纳
1
回答
处理设备驱动程序中的
浮点
值
c
、
linux
、
kernel
、
driver
我正在写sysfs相关的
Linux
设备驱动程序代码。我对如何处理变量上的
浮点
运算
感到困惑。有没有什么函数可以用来处理
浮点
操作,或者有谁知道在
Linux
内核设备驱动程序中处理
浮点
操作的最好方法?代码: volts *= 250;我想在内核部分处理这样的操作,
浮点
值应该是准确的。
浏览 19
提问于2021-07-16
得票数 0
1
回答
Linux
中
浮点
的
性能
linux
、
benchmark
、
floating-point
我已经为我的电脑测试了视窗和
Linux
的Geekbench。看来
Linux
在
浮点
性能
上明显下降。 我能做些什么吗?安装优化库?换个环境?
浮点
算法的差异如何解释?
浏览 0
提问于2013-09-24
得票数 0
回答已采纳
3
回答
定点
运算
值得我费心吗?
performance
、
floating-point
、
x86
、
fixed-point
因此,
性能
很重要。 现在,我看到了许多紧凑的循环,每个循环占执行时间的很大一部分:没有单一的瓶颈。这些循环中的大多数都做了一些
浮点
运算
,但它们之间有很多分支。
浮点
运算
主要限于加法、减法、乘法、除法和比较。所有这些都是使用32位
浮点
数完成的。我的目标平台是至少包含SSE1指令的x86。(我已经在汇编程序输出中验证了编译器确实生成了SSE指令。)我使用的大多数
浮点
值都有一个相当小的上限,接近零值的精度并不是很重要。所以我突然想到:也许改用定点
运算
可以加快速
浏览 0
提问于2010-04-19
得票数 12
回答已采纳
2
回答
运行在Windows和
Linux
/Ubuntu上的Benchmark测试软件
windows
、
linux
、
ubuntu
、
benchmarking
我想知道是否有可以下载的基准测试软件,可以在Windows (最好是Windows 7)和
Linux
(Ubuntu 9.10)上运行?Passmark
性能
测试只在Windows下运行。
浏览 0
提问于2010-03-11
得票数 3
回答已采纳
1
回答
使用
浮点
操作对整数数据旋转正确操作?
floating-point
、
integer
、
bitwise-operators
我想用一个无符号整数表示的值,并以某种方式,使用
浮点
操作,执行一个旋转右移位位操作。 看看这里使用的聪明: --它使用一个神奇的值和一些技巧来使用整数操作对
浮点
数执行操作。我想要的正好相反;我使用的硬件对
浮点
进行了很大的优化,但是对整数操作的
性能
很差。该算法采用sha256算法,充分利用了旋转权
运算
。
浏览 2
提问于2011-05-09
得票数 2
6
回答
Android上常见的
性能
陷阱?
java
、
android
、
performance
、
optimization
、
dalvik
什么是最容易犯的错误,可能是Android的
性能
下沉?为了便于讨论,让我们假设它在G1/类似设备上运行。
浏览 4
提问于2009-10-01
得票数 5
回答已采纳
6
回答
Invert 4x4矩阵-所需的数值最稳定解
language-agnostic
、
matrix
、
linear-algebra
、
fixed-point
、
matrix-inverse
使用
浮点
运算
时,我通常只需构建伴随矩阵并除以行列式(例如,暴力破解)。到目前为止,这对我来说是有效的,但当处理定点数字时,由于使用了所有乘法,我得到了不可接受的精度损失。注意:在定点
运算
中,我总是丢弃直接结果的一些最低有效位。 那么,求逆矩阵的最稳定的数值方法是什么?我不太在意
性能
,但简单地使用
浮点
将会减慢我的目标架构。
浏览 1
提问于2008-10-01
得票数 13
回答已采纳
7
回答
这些天什么时候使用固定点
optimization
、
floating-point
、
performance
、
numerical
、
fixed-point
对于密集的数字
运算
,我考虑使用定点而不是
浮点
。当然,固定点类型的大小是多少字节,它将在什么CPU上运行,如果我可以使用(对于Intel) MMX或SSE或任何新出现的东西,这都是很重要的。我在想,如果现在
浮点
运算
的速度比以往任何时候都快,那么是否值得考虑定点?有没有一般的经验法则,我们可以说它会比几个百分点更重要?从35,000英尺的数值
性能
来看,情况如何?
浏览 0
提问于2008-10-05
得票数 23
回答已采纳
4
回答
为什么我可以在
Linux
内核模块中执行
浮点
操作?
c
、
linux
、
gcc
、
linux-kernel
、
x86
作为实验,我将以下函数编译成一个基本的字符驱动程序模块,以了解
Linux
内核对
浮点
操作的反应。这似乎很奇怪;我以为您不能在
Linux
内核中执行
浮点
操作--除了一些例外,比如kernel_fpu_begin()。模块是如何执行
浮点
运算
的? 这是因为我使用的是x86处理器吗?
浏览 0
提问于2013-04-09
得票数 17
回答已采纳
1
回答
C++0x优化编译器质量
c++
、
performance
、
optimization
、
g++
、
c++11
我做了一些繁重的数字
运算
,对我来说
浮点
运算
的
性能
非常重要。我非常喜欢英特尔编译器的
性能
,并对它产生的汇编质量相当满意。
性能
是否可与C++相媲美?有什么基准吗?谢谢。 ps:在某种程度上,我会亲自测试它,但我想知道相对于C++会有什么期待。
浏览 0
提问于2010-04-21
得票数 12
回答已采纳
10
回答
单精度
浮点
运算
和双精度
浮点
运算
有什么区别?
floating-point
、
precision
、
processor
、
operations
单精度
浮点
运算
和双精度
浮点
运算
有什么区别? 我特别感兴趣的是与视频游戏机相关的实用术语。例如,任天堂64是否有64位处理器,如果有,这是否意味着它能够进行双精度
浮点
运算
?PS3和Xbox360可以实现双精度
浮点
运算
,还是只能实现单精度
浮点
运算
,并且通常使用双精度功能(如果它们存在的话?)。
浏览 3
提问于2009-04-29
得票数 186
回答已采纳
1
回答
确定ASM程序的FLOPS
c
、
assembly
、
arm
、
neon
、
flops
现在我们已经实现了所有这些算法,我们想知道与通常的矩阵乘法相比,它们的
性能
有多高。我们已经实现了代码来测量所有这些算法的运行时间,但现在我们决定还要知道我们可以执行多少次每秒的
浮点
运算
(FLOPS)。architecture: 7CPU part : 0xc08我们的第一个想法是现在实现一种FPO计数器,我们在每次
浮点
操作(算术操作以及比较和移动操作)后递增,但这意味着我们必须在代码中插入递增操作,这也会减慢应用程序...有没有人知道有没
浏览 3
提问于2015-01-26
得票数 10
1
回答
用于
浮点
行为的C++调试器或取消链接器
gcc
、
floating-point
、
debugging
我的程序使用了一些
浮点
运算
。在我自己的工作站上,它按预期工作,但在另一台机器上,它出现了奇怪的
浮点
错误。这两台机器在
Linux
上都使用了gcc 4.4.3,所有对象的编译器行都是是否有调试器或代码检查器("unlinter")专门用于在运行时检测可能的意外
浮点<
浏览 1
提问于2011-05-26
得票数 0
1
回答
如何将432位
浮点
数存储到128位xmm寄存器中?
assembly
、
x86
、
x86-64
、
sse
、
simd
我想将432位
浮点
数存储到xmm0中,其中每个
浮点
数都存储在一个128位寄存器中。例如,我有4个
浮点
数: xmm1: 10.2 xmm2: 5.8 xmm3: 9.3 xmm4: 12.7 (每个
浮点
数仅使用128位寄存器的32位),并希望将它们存储到xmm0中: 10.2、5.8、然后,在对xmm0做了一些数学
运算
之后,我还想分别提取它们(例如,覆盖..) 我试过使用movlps和movhps,但它们只使用内存来加载,而不使用128位寄存器作为源。由于
性能
原因,我不想使用任何额外的内存
浏览 0
提问于2019-07-05
得票数 4
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
【一问一答】Excel中因浮点运算导致的运算精度误差
毫末发布 MANA OASIS自动驾驶智算中心,每秒浮点运算 67 亿亿次
Linux性能监控
毫末发布自动驾驶智算中心MANA OASIS, OASIS 每秒浮点运算67亿亿次
毫末发布自动驾驶智算中心MANA OASIS,OASIS 每秒浮点运算67亿亿次
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券