本篇文章主要讲解 Swift 中常用的协议协议Protocol,主要分析protocol的用法及底层存储结构。
2. 基本用法
先来看看 Swift 中协议的基本用法(和 OC 的差别不大)👇
协议的语法格式👇
protocol MyProtocol {
// body
}
struct LGTeacher: Protocol1, Protocol2 {
// body
}
struct LGTeacher: NSObject, Protocol1, Protocol2 {
// body
}
再来看看协议中的属性,需要注意2点👇
protocol LGTestProtocol {
var age: Int {get set}
}
最后看看协议中的方法,和 OC 一样,只需声明不需实现。例如👇
protocol MyProtocol {
func doSomething()
static func teach()
}
然后类遵循了该协议,必须实现协议中的方法👇
class LGTeacher: MyProtocol{
func doSomething() {
print("LGTeacher doSomething")
}
static func teach() {
print("LGTeacher teach")
}
}
var t = LGTeacher()
t.doSomething()
LGTeacher.teach()
protocol MyProtocol {
init(age: Int)
}
class LGTeacher: MyProtocol {
var age: Int
required init(age: Int) {
self.age = age
}
}
3. 进阶用法
协议的进阶用法 👉 将协议作为类型,主要有以下3种情况👇
先看看,下面的代码输出结果是什么?👇
class Shape{
var area: Double{
get{
return 0
}
}
}
class Circle: Shape{
var radius: Double
init(_ radius: Double) {
self.radius = radius
}
override var area: Double{
get{
return radius * radius * 3.14
}
}
}
class Rectangle: Shape{
var width, height: Double
init(_ width: Double, _ height: Double) {
self.width = width
self.height = height
}
override var area: Double{
get{
return width * height
}
}
}
var circle: Shape = Circle.init(10.0)
var rectangle: Shape = Rectangle.init(10.0, 20.0)
var shapes: [Shape] = [circle, rectangle]
for shape in shapes{
print(shape.area)
}
上面的代码是基于继承的方式来实现的,基类中的area必须有一个默认实现。当然,这种情况也可以采用协议的方式来实现👇
protocol Shape {
var area: Double {get}
}
class Circle: Shape{
var radius: Double
init(_ radius: Double) {
self.radius = radius
}
var area: Double{
get{
return radius * radius * 3.14
}
}
}
class Rectangle: Shape{
var width, height: Double
init(_ width: Double, _ height: Double) {
self.width = width
self.height = height
}
var area: Double{
get{
return width * height
}
}
}
var circle: Shape = Circle.init(10.0)
var rectangle: Shape = Rectangle.init(10.0, 20.0)
var shapes: [Shape] = [circle, rectangle]
for shape in shapes{
print(shape.area)
}
shape变成了协议,提供了一个只读属性area,遵循该协议的类都要 实现 age 的get方法。接着我们再来看var shapes 👉 里面的元素存在2种情况👇
那如何让数组 shapes 里的元素是协议?👉 让协议默认实现 area 的 get 方法👇
protocol Shape {
}
extension Shape{
var area: Double {
get{return 0}
}
}
然后,我们这么调用,看看输出什么?👇
var circle: Shape = Circle.init(10.0)
print(circle.area)
输出是0.0,为什么不是10*10*3.14?因为在协议Shape的extension中,声明的方法是静态调用,那么在编译期间代码的地址就定下来了,是无法改变的,这点我们可以用SIL代码来验证👇
上图 SIL 代码中可以看出,Circle.init(10.0)初始化里虽然传递的是10.0,但是SIL代码中初始化确使用的是Builtin.FPIEEE64,而Builtin.FPIEEE64恰巧是shape协议extension中实现的area的get方法的返回值(即是0),最后我们再练看看circle.area 方法源码👇
调用的也是$Builtin.FPIEEE64 👉 0.0,所以print(circle.area)输出当然是0.0。
4. 底层原理
我们先来看看下面的案例输出什么?👇
protocol MyProtocol {
func teach()
}
extension MyProtocol{
func teach(){ print("MyProtocol") }
}
class MyClass: MyProtocol{
func teach(){ print("MyClass") }
}
let object: MyProtocol = MyClass()
object.teach()
let object1: MyClass = MyClass()
object1.teach()
为什么输出的结果一样呢?老规矩,从 SIL 分析👇
从上图中我们知道👇
接着我们在SIL代码中分别搜索#MyProtocol.teach和#MyClass.teach👇
发现了两个方法列表:MyClass的sil_vtable和sil_witness_table:
而sil_witness_table里面其实调用的还是 MyClass 的 teach 方法👇
这也是为什么object.teach()输出的是MyClass的原因。
//如果去掉协议中的声明呢?打印结果是什么
protocol MyProtocol {
}
extension MyProtocol{
func teach(){ print("MyProtocol") }
}
class MyClass: MyProtocol{
func teach(){ print("MyClass") }
}
let object: MyProtocol = MyClass()
object.teach()
let object1: MyClass = MyClass()
object1.teach()
继续 SIL 分析👇
上图可知👇
上图可知,查看 SIL 中的 witness_table,其中已经没有teach方法,因为👇
我们在分析函数调度时,已经知道了V-Table是存储在metadata中的,而且根据上面的分析,协议中的方法存储在PWT,那PWT存储在哪里呢?接下来我们来探究一下。 首先我们来看看下面的示例,输出什么?👇
protocol Shape {
var area: Double {get}
}
class Circle: Shape{
var radius: Double
init(_ radius: Double) {
self.radius = radius
}
var area: Double{
get{
return radius * radius * 3.14
}
}
}
var circle: Shape = Circle(10.0)
print(MemoryLayout.size(ofValue: circle))
print(MemoryLayout.stride(ofValue: circle))
var circle1: Circle = Circle(10.0)
print(MemoryLayout.size(ofValue: circle1))
print(MemoryLayout.stride(ofValue: circle1))
circle 的类型是协议Shape,而 circle1 的类型是类Circle,输出结果👇
circle 的size和stride均为40,why?
circle首地址的metadata地址中,heapObject里保存了10这个值。
我们发现,SIL 中,系统是通过调用init_existential_addr读取之前声明的 circle 变量,而 circle1 却是👇
circle是通过调用 load 指令读取的,那么init_existential_addr这个指令代表什么意思呢?我们去 SIL 官网说明文档,查到👇
上图中的existential container是编译器生成的一种特殊的数据类型,也用于管理遵守了相同协议的协议类型。因为这些数据类型的内存空间尺寸不同,使用existential container进行管理可以实现存储一致性。
所以,系统使用existential container容器包含了Shape类型,接着调用existential container这个类型来初始化circle变量,相当于对circle包装了一层。那么,重点就来到了existential container,接下来我们通过 IR 代码,看看这个容器中存储的数据格式是什么样的?
也就是最终结构是{ heapObject, metadata, PWT },这和之前 lldb 查看的内存分布一模一样!
接下来,我们可以尝试仿写 IR 的 main 函数这块内存绑定的流程,代码👇
// HeapObject结构体(Swift类的本质)
struct HeapObject {
var type: UnsafeRawPointer
var refCount1: UInt32
var refCount2: UInt32
}
// %T4main5ShapeP = type { [24 x i8], %swift.type*, i8** }
struct protocolData {
//24 * i8 :因为是8字节读取,所以写成3个指针,正好24字节
var value1: UnsafeRawPointer
var value2: UnsafeRawPointer
var value3: UnsafeRawPointer
//type 存放metadata,目的是为了找到Value Witness Table 值目录表
var type: UnsafeRawPointer
// i8* 存放pwt,即协议的方法列表
var pwt: UnsafeRawPointer
}
// 2、定义协议+类
protocol Shape {
var area: Double {get}
}
class Circle: Shape{
var radius: Double
init(_ radius: Double) {
self.radius = radius
}
var area: Double{
get{
return radius * radius * 3.14
}
}
}
//对象类型为协议
var circle: Shape = Circle(10.0)
// 3、将circle强转为protocolData结构体
withUnsafePointer(to: &circle) { ptr in
ptr.withMemoryRebound(to: protocolData.self, capacity: 1) { pointer in
print(pointer.pointee)
}
}
运行👇
至此,我们知道了PWT的存储位置👇
存储在一个existential container容器中,该容器的大致结构是{ heapObject, metadata, PWT }
我们再定义一个结构体Rectangle,也遵循Shape协议👇
protocol Shape {
var area: Double {get}
}
struct Rectangle: Shape{
var width, height: Double
init(_ width: Double, _ height: Double) {
self.width = width
self.height = height
}
var area: Double{
get{
return width * height
}
}
}
//对象类型为协议
var rectangle: Shape = Rectangle(10.0, 20.0)
struct HeapObject {
var type: UnsafeRawPointer
var refCount1: UInt32
var refCount2: UInt32
}
// %T4main5ShapeP = type { [24 x i8], %swift.type*, i8** }
struct protocolData {
//24 * i8 :因为是8字节读取,所以写成3个指针
var value1: UnsafeRawPointer
var value2: UnsafeRawPointer
var value3: UnsafeRawPointer
//type 存放metadata,目的是为了找到Value Witness Table 值目录表
var type: UnsafeRawPointer
// i8* 存放pwt
var pwt: UnsafeRawPointer
}
//将circle强转为protocolData结构体
withUnsafePointer(to: &rectangle) { ptr in
ptr.withMemoryRebound(to: protocolData.self, capacity: 1) { pointer in
print(pointer.pointee)
}
}
Rectangle有2个成员width和height,所以protocolData中的 value1 和 value2 分别存储着他们的值👇
接下来我们看看 IR 代码中是怎么处理的👇
上图可知,width所对应的%4是从0开始偏移存储8字节,那么就是0~7,而height对应的5%是从1开始的,就是8~15。(如果Rectangle是类class的话,应该都是存储在0~7,因为存储的是HeapObject)
继续修改,再添加一个属性,变成3个属性呢?👇
struct Rectangle: Shape{
var width, height: Double
var width1 = 30.0
init(_ width: Double, _ height: Double) {
self.width = width
self.height = height
}
var area: Double{
get{
return width * height
}
}
}
从结果中可以看出,width1是存储在value3。
继续,4个属性呢?👇
struct Rectangle: Shape{
var width, height: Double
var width1 = 30.0
var height1 = 40.0
init(_ width: Double, _ height: Double) {
self.width = width
self.height = height
}
var area: Double{
get{
return width * height
}
}
}
我们再看看 value1 的地址👇
所以Protocol协议在底层的存储结构👇
继续修改例子,将Rectangle改为class,声明一个数组存储circle 和 rectangle对象👇
protocol Shape {
var area: Double {get}
}
class Circle: Shape{
var radius: Double
init(_ radius: Double) {
self.radius = radius
}
var area: Double{
get{
return radius * radius * 3.14
}
}
}
class Rectangle: Shape{
var width, height: Double
init(_ width: Double, _ height: Double) {
self.width = width
self.height = height
}
var area: Double{
get{
return width * height
}
}
}
var circle: Shape = Circle.init(10.0)
var rectangle: Shape = Rectangle.init(10.0, 20.0)
var shapes: [Shape] = [circle, rectangle]
for shape in shapes{
print(shape.area)
}
我们知道,protocol 中存储了 pwt,pwt 的内部也是通过class_method查找,在代码运行过程中,底层通过容器结构体,将metadata和pwt关联起来,所以可以根据metadata找到对应的v-table,从而完成方法的调用。所以,上图中输出的 314 和 200 就说明了 👉 系统是去各自的类中查找属性 area 的 get 方法。
再看下面的示例👇(将Rectangle还原回结构体,然后再声明一个变量 rectangle1 = rectangle)
struct Rectangle: Shape{
var width, height: Double
var width1 = 30.0
var height1 = 40.0
init(_ width: Double, _ height: Double) {
self.width = width
self.height = height
}
var area: Double{
get{
return width * height
}
}
}
//对象类型为协议
var rectangle: Shape = Rectangle(10.0, 20.0)
//将其赋值给另一个协议变量
var rectangle1: Shape = rectangle
然后使用withMemoryRebound绑定值到结构体protocolData中查看内存👇
// 查看其内存地址
struct HeapObject {
var type: UnsafeRawPointer
var refCount1: UInt32
var refCount2: UInt32
}
// %T4main5ShapeP = type { [24 x i8], %swift.type*, i8** }
struct protocolData {
//24 * i8 :因为是8字节读取,所以写成3个指针
var value1: UnsafeRawPointer
var value2: UnsafeRawPointer
var value3: UnsafeRawPointer
//type 存放metadata,目的是为了找到Value Witness Table 值目录表
var type: UnsafeRawPointer
// i8* 存放pwt
var pwt: UnsafeRawPointer
}
withUnsafePointer(to: &rectangle) { ptr in
ptr.withMemoryRebound(to: protocolData.self, capacity: 1) { pointer in
print(pointer.pointee)
}
}
withUnsafePointer(to: &rectangle1) { ptr in
ptr.withMemoryRebound(to: protocolData.self, capacity: 1) { pointer in
print(pointer.pointee)
}
}
从输出结果来看,两个协议变量rectangle和rectangle1内存地址是一模一样的。 如果修改rectangle1的width属性的值(需要将width属性声明到protocol)👇
protocol Shape {
var width: Double {get set}
var area: Double {get}
}
调用代码👇
withUnsafePointer(to: &rectangle) { ptr in
ptr.withMemoryRebound(to: protocolData.self, capacity: 1) { pointer in
print(pointer.pointee)
}
}
withUnsafePointer(to: &rectangle1) { ptr in
ptr.withMemoryRebound(to: protocolData.self, capacity: 1) { pointer in
print(pointer.pointee)
}
}
rectangle1.width = 50.0
withUnsafePointer(to: &rectangle1) { ptr in
ptr.withMemoryRebound(to: protocolData.self, capacity: 1) { pointer in
print(pointer.pointee)
}
}
修改前 rectangle和rectangle1的heapObject也就是value1相同0x00000001005421b0,修改后rectangle1的heapobject变成了0x0000000100611720。这里也就验证了struct值类型(虽然超过了24字节存储到了堆上)【写时赋值】👇
当复制时,并没有值的修改,所以两个变量指向同一个堆区内存,当第二个变量修改了属性值时,会将原本堆区内存的值拷贝到一个新的堆区内存,并进行值的修改
如果将struct值类型改为class引用类型,结果会怎样?
class Rectangle: Shape{
var width: Double
var height: Double
var width1 = 30.0
var height1 = 40.0
init(_ width: Double, _ height: Double) {
self.width = width
self.height = height
}
var area: Double{
get{
return width * height
}
}
}
上图可知,修改前后,地址没有发生任何变化!
Value Buffer在容器existential container中的位置👇
总结
本篇文章讲解了Swift中有一个重要的概念 👉 协议Protocol,从基础概念、用法,进阶用法和底层这条主线,详细讲解了值类型struct与引用类型class遵循协议时,其PWT和Value Buffer的内存地址的分布,希望大家掌握,从容应对面试。