腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何计算程序执行期间(
CPU
周期
)和(
指令
已退役)的总数?
c++
我在
Linux
上用C++编程。我想将这些系统与我的系统在
CPU
周期
、花费和退出
指令
的数量方面进行比较。如何计算程序执行期间(
CPU
周期
)和(
指令
已退役)的总数? 我需要访问任何硬件计数器吗?或者有什么著名的方法来实现这一目标?
浏览 2
提问于2017-03-03
得票数 3
回答已采纳
3
回答
在
linux
中定期读取性能计数器
linux
、
perf
linux
中有没有一种定期读取性能计数器的方法?基本上,对于某些程序,我希望能够每X个
cpu
周期
读取
指令
计数器(执行的
指令
数量)。
浏览 0
提问于2012-08-27
得票数 6
回答已采纳
1
回答
机器
周期
、总线
周期
和执行
周期
的区别
hardware
、
execution
、
bus
我无法理解总线循环、
指令
循环和机器循环之间的区别。请帮帮我。谢谢
浏览 1
提问于2012-04-30
得票数 12
2
回答
突发模式DMA如何加快主存与I/O设备之间的数据传输?
dma
根据维基百科的说法,DMA模式有三种,即突发模式、
周期
窃取模式和透明模式。在突发模式下,dma控制器将接管总线的控制。在传输完成之前,需要总线的
CPU
任务将被挂起。但是,在每个
指令
周期
中,
获取
周期
必须引用主内存。因此,在传输过程中,
CPU
将处于空闲状态,不做任何工作,这与在中断驱动的IO下被传输工作占用的任务本质上是一样的。在我看来,循环盗窃模式本质上是一样的。唯一的区别是,在这些模式中,
CPU
使用两个连续
周期
中的一个,而不是在半衰期
浏览 5
提问于2016-06-24
得票数 0
回答已采纳
1
回答
x86
CPU
增量eip(PC)中的
获取
阶段是否到下一条
指令
?
assembly
、
x86
、
cpu-architecture
、
program-counter
在x86
CPU
的
指令
周期
的取取阶段,我想知道eip(PC)寄存器是在这个阶段的末尾(
获取
阶段)还是在执行阶段之后存储下一个
指令
?我知道MIPS
CPU
在
获取
阶段结束时会增加eip,但是x86
CPU
也在这么做吗?我认为这是因为在查看某个程序的编译代码之后,我注意到“相对调用
指令
”编码中的地址相对于next
指令
,而不是当前
指令
。
浏览 4
提问于2022-03-14
得票数 2
1
回答
技术计算:每个
周期
的
CPU
指令
和每个
周期
的flops是相同的吗?
cluster-computing
每
周期
的
CPU
指令
和每
周期
的flops是否相同?英特尔(R)酷睿(TM) i5-2540M
CPU
@2.60
CPU
浏览 3
提问于2014-06-16
得票数 0
1
回答
在x86上
获取
当前时间的
指令
performance
、
time
、
x86
、
instructions
是否有获得当前时间的x86
指令
? 基本上..。就像clock_get_time的替代品..。最低的开销..。我不关心用任何特定的方式来获得时间.只要这是我能用的格式。我对_rdtsc不感兴趣,因为它衡量的是经过的
周期
数。我需要知道有多少物理时间..。不会因为热旋涡左右的变化而变化的
周期
。
浏览 9
提问于2015-08-05
得票数 4
回答已采纳
1
回答
流水线:在条件分支中寻找额外的循环?
caching
一个
CPU
有五个阶段的pipeline.Instruction读取发生在流水线的第一阶段。条件分支
指令
计算目标地址并评估流水线的第三级中的条件。处理器在条件分支之后停止
获取
新
指令
,直到知道分支结果为止。一个程序执行10^9条
指令
,其中20%是分支
指令
。如果每条
指令
需要一个时钟
周期
来完成,那么求出程序的总执行时间??给定
CPU
频率1 1GHz。 答案是1.4秒。请解释一下分支的额外
周期
是如何计算的??
浏览 2
提问于2014-01-29
得票数 0
2
回答
周期
精确仿真
cpu
、
emulation
、
68000
我目前正在为我的下一个仿真项目学习C语言,一个
周期
精确的68000内核(我的上一个项目是一个用Java编写的非
周期
精确的Sega Master系统仿真器,现在已经是它的第三个版本)。我的查询认为
周期
级别的准确性对我来说是一件新的事情。要将事情分解到1个
CPU
周期
的粒度,我可能需要知道内存访问需要多长时间等等,但我的问题是,对于在内存
获取
/写入阶段需要多个
周期
的
指令
,
CPU
在每个
周期
做什么-例如,每个
浏览 0
提问于2012-06-22
得票数 4
回答已采纳
2
回答
当带有
指令
的内存被另一个内核更改时,
CPU
管道会发生什么情况?
assembly
、
x86
、
pipeline
、
cpu-architecture
、
hotpatching
我试图了解
CPU
管道的“
获取
”阶段是如何与内存交互的。我发现这个提到“在每个时钟
周期
从
指令
缓存内存中
获取
一个32字节的缓存行”,我认为这可以解释为每条
指令
从L1获得缓存行的一个新副本,即使它们共享相同的缓存行。但我不知道这是否/如何适用于现代
CPU
。但是,如果mov $2的提取将mov $3引入到“
指令
缓存”中,那么认为下一次
获取
只从缓存中
获取
指令
(并返回mov $3)而不重新查询L1有意
浏览 9
提问于2021-06-15
得票数 2
回答已采纳
1
回答
获取
调用的微操作
assembly
、
microcoding
我正在尝试理解
cpu
如何在微操作中写入32位调用
指令
的
获取
周期
。MDR is 8 bits wideIR is 16 bits wide我的问题源于这样一个事实:
指令
是
获取
周期
是这样的: PC <- PC +
浏览 9
提问于2013-02-12
得票数 3
回答已采纳
1
回答
cpu
中的CPI与流水线
cpu-architecture
假设在
CPU
中,用于添加
指令
的CPI为0.5 (它通过流水线在一个
周期
内执行两个添加
指令
)。因此,当我们想要计算10加法
指令
的
CPU
时间时,我们乘以10 * 0.5 *2(时钟
周期
时间为2纳秒),一切正常。 但是,当只有一个加法
指令
,根据公式,我们乘1* 0.5 *2,这是不正确的。因为它至少需要一个时钟
周期
来执行添加
指令
。
浏览 4
提问于2019-03-04
得票数 1
回答已采纳
1
回答
目前的硬件能否实现亚微秒级的时钟分辨率?
x86-64
、
clock
该线程从GPS参考中
获取
当前时间。
浏览 1
提问于2015-10-23
得票数 1
1
回答
反VM的时间检查不太好?
c
、
linux
我尝试使用rdtsc
指令
获取
cpu
周期
,并比较实际
linux
机器和在virtualbox上运行的
linux
之间的结果。但结果似乎不稳定。有时,来自真正机器的
cpu
周期
甚至大于virtualbox中的
cpu
周期
。这种技术假设
cpu
速度这样的硬件是相同的吗?如果是这样的话,我很困惑它究竟是如何运作的。
浏览 2
提问于2014-06-04
得票数 1
回答已采纳
1
回答
正确预测的分支(在任何
CPU
上)的成本是多少?
branch
、
branch-prediction
根据我所读到的,它的成本可能是0
周期
。它真的是0
周期
吗?如果成本是0
周期
,这是否包括跳转
指令
本身而不是
CPU
指令
缓存中可能出现的刷新?我很感激对任何
CPU
架构的回答。
浏览 6
提问于2017-11-17
得票数 0
回答已采纳
1
回答
流水线处理器与单
周期
处理器
cpu
、
pipeline
、
cpu-registers
、
computer-architecture
、
mips32
我必须比较使用DLX流水线和单
周期
处理器执行以下代码的速度(见图)。单
周期
模型中的
指令
需要800 ps。我的做法如下。
CPU
时间= CPI * CC * IC
CPU
时间=1* 800 ps * 10 instr。= 8000 ps。CPI =21个
周期
/ 10 CPI。=每条
指令
2.1
周期
CPU
时间= 2.1 * 20
浏览 2
提问于2014-06-14
得票数 0
回答已采纳
1
回答
如何计算ANSI C代码的性能?
c++
、
c
、
profiling
我测量了执行时间(在Windows操作系统下使用clock()函数,在
Linux
操作系统下使用clock_gettime() )。现在我想要计算,在运行我的代码时,我的
CPU
执行了多少IPSes (每秒的
指令
数)。(是的,我知道MIPS是一个可悲的参数,但即使这样,我也想计算它) 也很高兴看到,执行3个元素和我执行的其他操作需要多少个CPIs (每条
指令
的
周期
)。我还没有发现任何C/C++函数会返回执行所需的时钟
周期
数,例如访问局部变量。还有一个问题是要找到Intel/
浏览 1
提问于2012-04-10
得票数 0
1
回答
涉及内存访问的mov
指令
的执行速度是否比寄存器之间的mov慢
performance
、
caching
、
cpu-architecture
它通常需要4个
cpu
周期
(参考),而寄存器访问需要一个
cpu
周期
。因此,简单地比较寄存器之间的mov
指令
,例如“movl%eax,%ebx”与包含内存的mov
指令
"movl (%eax),%ebx",后者是否总是比前者多花费4个
周期
?如果是,
CPU
在等待内存数据时会做什么?
浏览 1
提问于2018-04-04
得票数 0
1
回答
为什么nop不走一个时钟
周期
?
c
、
x86
、
inline-assembly
、
rdtsc
、
cpu-cycles
我编写了一个基本代码来了解nop占用的时钟
周期
的数量。我们知道nop需要一个时钟
周期
。
浏览 9
提问于2020-01-12
得票数 0
1
回答
大多数资源密集的装配
指令
?
attacks
、
appsec
、
ddos
、
denial-of-service
假设我想让运行某种web应用程序或游戏服务器的服务器过载,那么我最好的方法是找出web应用程序或游戏服务器上哪些合法功能的使用使用最多的
cpu
周期
或磁盘使用量?这是假设我不能在我自己的机器上安装相同的web应用程序或游戏服务器,然后监控
cpu
的使用情况,同时我要求从服务器中
获取
不同的东西,以确定什么是使用最多
cpu
周期
的。是否有任何资源特别重的ASM
指令
经常被调用? 他们最常打电话给什么时候?(我可以强制服务器调用这些函数/
指令
的一般方法是什
浏览 0
提问于2017-11-01
得票数 -3
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
人人都应该知道的CPU缓存运行效率
Intel PAUSE指令变化影响到MySQL的性能,该如何解决?
通过vmstat学习CPU和进程性能监控
Intel 为 Linux 贡献 KCPUID 实用程序,以可靠地报告 CPU 特性
CPU是什么意思|CPU的工作原理
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券