今天在理解读写自旋锁的实现的时候,看到了WFE指令,对其不理解。通过调查,弄清楚了它的来龙去脉,记录一下。在此,还要特别感谢窝窝科技的这篇文章【ARM WFI和WFE指令】,让我茅塞断开。
WFI(Wait for interrupt)
和WFE(Wait for event)
是两个让ARM核进入低功耗待机
模式的指令,由ARM架构规范定义,由ARM核实现。
DDI0487A_d_armv8_arm.pdf
的描述),主要是“将ARMv8-A PE
(Processing Element
, 处理单元)设置为低功耗待机状态
”。
需要说明的是,ARM架构并没有规定“低功耗待机状态
”的具体形式。因而,可以由IP核自由发挥,根据ARM的建议,一般可以实现为standby
(关闭clock、保持供电)、dormant
、shutdown
等等。但有个原则,不能造成内存一致性的问题。以Cortex-A57 ARM core
为例,它把WFI和WFE实现为“put the core in a low-power state by disabling the clocks in the core while keeping the core powered up
”,即我们通常所说的standby模式,保持供电,关闭clock。“DDI0487A_d_armv8_arm.pdf
“的描述。而最大的不同是,WFE可以被任何PE上执行的SEV
指令唤醒。
所谓的SEV
指令,就是一个用来改变事件寄存器的指令,有两个:SEV
会修改所有PE上的寄存器;SEVL
,只修改本PE的寄存器值。下面让我们看看WFE这种特殊设计的使用场景。WFI
一般用于cpu空闲时。spinlock
中(可参考arch_spin_lock
,对arm64来说,位于arm64/include/asm/spinlock.h
中)。spinlock的功能,是在不同CPU核之间,保护共享资源。使用WFE的流程是:我们在学习spinlock的时候,已经知道,当申请lock失败的时候,CPU核会进入忙等待,比如著名的x86架构。而ARM本身就是低功耗处理器的代名词,所以通过在申请lock的过程中,插入WFE指令,可以节省一点功耗,充分将低功耗设计发挥到了极致。
当没有获取spinlock的时候,CPU核会调用wfe,等待其他cpu使用sev来唤醒自己。
在ARM64中,arch_spin_unlock
并没有显示的调用sev来唤醒其他cpu,而是通过stlr指令完成的。在ARM ARM文档中有说:在执行store操作的时候,如果要操作的地址被标记为exclusive的,那么global monitor的状态会从exclusive access变成open access,同时会触发一个事件,唤醒wfe中的cpu。
本文分享自 嵌入式ARM和Linux 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!