🔥 Hi,我是小彭。本文已收录到 GitHub · AndroidFamily[1] 中。
提示:本文源码分析基于 Android 9.0 ART 虚拟机。
学习路线图:

Java 引用是 Java 虚拟机为了实现更加灵活的对象生命周期管理而设计的对象包装类,一共有四种引用类型,分别是强引用、软引用、弱引用和虚引用。我将它们的区别概括为 3 个维度:
除了我们熟悉的四大引用,虚拟机内部还设计了一个 @hide 的FinalizerReference 引用,用于支持 Java Finalizer 机制,更多内容见 Finalizer 机制。
引用、指针和句柄都具有指向对象地址的含义,可以将它们都简单地理解为一个内存地址。只有在具体的问题中,才需要区分它们的含义:
直接指针访问:

句柄访问:

这一节我们来讨论如何将引用与引用队列的使用方法。
Reference#get() 可以获取实际对象,在实际对象被回收之后 get() 将返回 null,而虚引用调用 get() 方法永远是返回 null;Reference#clear() 可以提前解除关联关系。get() 和 clear() 最终是调用 native 方法,我们在后文分析。
SoftReference.java
// 已简化
public class SoftReference<T> extends Reference<T> {
public SoftReference(T referent) {
super(referent);
}
public SoftReference(T referent, ReferenceQueue<? super T> q) {
super(referent, q);
}
}
WeakReference.java
public class WeakReference<T> extends Reference<T> {
public WeakReference(T referent) {
super(referent);
}
public WeakReference(T referent, ReferenceQueue<? super T> q) {
super(referent, q);
}
}
PhantomReference.java
public class PhantomReference<T> extends Reference<T> {
// 虚引用 get() 永远返回 null
public T get() {
return null;
}
// 虚引用必须管理引用队列,否则没有意义
public PhantomReference(T referent, ReferenceQueue<? super T> q) {
super(referent, q);
}
}
Reference.java
// 引用对象公共父类
public abstract class Reference<T> {
// 虚拟机内部使用
volatile T referent;
// 关联引用队列
final ReferenceQueue<? super T> queue;
Reference(T referent) {
this(referent, null);
}
Reference(T referent, ReferenceQueue<? super T> queue) {
this.referent = referent;
this.queue = queue;
}
// 获取引用指向的实际对象
public T get() {
// 调用 Native 方法
return getReferent();
}
@FastNative
private final native T getReferent();
// 解除引用与实际对象的关联关系
public void clear() {
// 调用 Native 方法
clearReferent();
}
@FastNative
native void clearReferent();
...
}
以下为 ReferenceQueue 的使用模板,主要分为 2 个阶段:
ReferenceQueue#poll() 的返回值可以感知对象垃圾回收的时机。示例程序
// 阶段 1:
// 创建对象
String strongRef = new String("abc");
// 1、创建引用队列
ReferenceQueue<String> referenceQueue = new ReferenceQueue<>();
// 2、创建引用对象,并关联引用队列
WeakReference<String> weakRef = new WeakReference<>(strongRef, referenceQueue);
System.out.println("weakRef 1:" + weakRef);
// 3、断开强引用
strongRef = null;
System.gc();
// 阶段 2:
// 延时 5000 是为了提高 "abc" 被回收的概率
view.postDelayed(new Runnable() {
@Override
public void run() {
System.out.println(weakRef.get()); // 输出 null
// 观察引用队列
Reference<? extends String> ref = referenceQueue.poll();
if (null != ref) {
System.out.println("weakRef 2:" + ref);
// 虽然可以获取到 Reference 对象,但无法获取到引用原本指向的对象
System.out.println(ref.get()); // 输出 null
}
}
}, 5000);
程序输出
I/System.out: weakRef 1:java.lang.ref.WeakReference@3286da7
I/System.out: null
I/System.out: weakRef 2:java.lang.ref.WeakReference@3286da7
I/System.out: null
ReferenceQueue 中大部分 API 是面向 Java 虚拟机内部的,只有 ReferenceQueue#poll() 是面向开发者的。它是非阻塞 API,在队列有数据时返回队头的数据,而在队列为空时直接返回 null。
ReferenceQueue.java
public Reference<? extends T> poll() {
synchronized (lock) {
if (head == null)
return null;
return reallyPollLocked();
}
}
Cleaner 是虚引用的工具类,用于实现在对象被垃圾回收时额外执行一段清理逻辑,本质上只是将虚引用和引用队列等代码做了简单封装而已。以下为 Cleaner 的使用模板:
示例程序
// 1、创建对象
String strongRef = new String("abc");
// 2、创建清理逻辑
CleanerThunk thunk = new CleanerThunk();
// 3、创建 Cleaner 对象(本质上是一个虚引用)
Cleaner cleaner = Cleaner.create(strongRef, thunk);
private class CleanerThunk implements Runnable {
@Override
public void run() {
// 清理逻辑
}
}
Cleaner.java
// Cleaner 只不过是虚引用的工具类而已
public class Cleaner extends PhantomReference<Object> {
...
}
从这一节开始,我们来深入分析 Java 引用的实现原理,相关源码基于 Android 9.0 ART 虚拟机。
ReferenceQueue 是基于单链表实现的队列,元素按照先进先出的顺序出队(Java OpenJDK 和 Android 中的 ReferenceQueue 实现略有区别,OpenJDK 以先进后出的顺序出队,而 Android 以先进先出的顺序出队)。
Reference.java
public abstract class Reference<T> {
// 关联的引用队列
final ReferenceQueue<? super T> queue;
// 单链表后继指针
Reference queueNext;
}
ReferenceQueue.java
public class ReferenceQueue<T> {
// 入队
boolean enqueue(Reference<? extends T> reference) {
synchronized (lock) {
if (enqueueLocked(reference)) {
lock.notifyAll();
return true;
}
return false;
}
}
// 出队
public Reference<? extends T> poll() {
synchronized (lock) {
if (head == null)
return null;
return reallyPollLocked();
}
}
// 入队
private boolean enqueueLocked(Reference<? extends T> r) {
// 处理 Cleaner 逻辑
if (r instanceof Cleaner) {
Cleaner cl = (sun.misc.Cleaner) r;
cl.clean();
r.queueNext = sQueueNextUnenqueued;
return true;
}
// 尾插法
if (tail == null) {
head = r;
} else {
tail.queueNext = r;
}
tail = r;
tail.queueNext = r;
return true;
}
// 出队
private Reference<? extends T> reallyPollLocked() {
if (head != null) {
Reference<? extends T> r = head;
if (head == tail) {
tail = null;
head = null;
} else {
head = head.queueNext;
}
r.queueNext = sQueueNextUnenqueued;
return r;
}
return null;
}
}

在上一节我们提到 Reference#get() 和 Reference#clear() 可以获取或解除关联关系,它们是在 Native 层实现的。最终可以看到关联关系是在 ReferenceProcessor 中维护的,ReferenceProcessor内部我们先不分析了。
对应的 Native 层方法:
java_lang_ref_Reference.cc[2]
namespace art {
// 对应 Java native 方法 Reference#getReferent()
static jobject Reference_getReferent(JNIEnv* env, jobject javaThis) {
ScopedFastNativeObjectAccess soa(env);
ObjPtr<mirror::Reference> ref = soa.Decode<mirror::Reference>(javaThis);
ObjPtr<mirror::Object> const referent = Runtime::Current()->GetHeap()->GetReferenceProcessor()->GetReferent(soa.Self(), ref);
return soa.AddLocalReference<jobject>(referent);
}
// 对应 Java native 方法 Reference#clearReferent()
static void Reference_clearReferent(JNIEnv* env, jobject javaThis) {
ScopedFastNativeObjectAccess soa(env);
ObjPtr<mirror::Reference> ref = soa.Decode<mirror::Reference>(javaThis);
Runtime::Current()->GetHeap()->GetReferenceProcessor()->ClearReferent(ref);
}
// 动态注册 JNI 函数
static JNINativeMethod gMethods[] = {
FAST_NATIVE_METHOD(Reference, getReferent, "()Ljava/lang/Object;"),
FAST_NATIVE_METHOD(Reference, clearReferent, "()V"),
};
void register_java_lang_ref_Reference(JNIEnv* env) {
REGISTER_NATIVE_METHODS("java/lang/ref/Reference");
}
} // namespace art
引用对象加入引用队列的过程发生在垃圾收集器的处理过程中,我将相关流程概括为 2 个阶段:
unenqueued 中,随后 notify 正在等待类对象的线程 (阶段 1 实际的处理过程更复杂,我们稍后再详细分析);ReferenceQueue.java
// 临时的全局链表
public static Reference<?> unenqueued = null;
// 从 Native 层调用
static void add(Reference<?> list) {
synchronized (ReferenceQueue.class) {
// 此处使用尾插法将 list 加入全局链表 unenqueued,代码略
// 唤醒等待类锁的线程
ReferenceQueue.class.notifyAll();
}
}

那么,谁在等待这个类对象呢?其实,在虚拟机启动时,会启动一系列守护线程,其中就包括处理引用入队的 ReferenceQueueDaemon 线程和 Finalizer 机制的 FinalizerDaemon 线程,这里唤醒的正是ReferenceQueueDaemon 线程。
源码摘要如下:
runtime.cc[3]
void Runtime::StartDaemonThreads() {
// 调用 java.lang.Daemons.start()
Thread* self = Thread::Current();
JNIEnv* env = self->GetJniEnv();
env->CallStaticVoidMethod(WellKnownClasses::java_lang_Daemons, WellKnownClasses::java_lang_Daemons_start);
}
Daemons.java[4]
public static void start() {
// 启动四个守护线程:
// ReferenceQueueDaemon:处理引用入队
ReferenceQueueDaemon.INSTANCE.start();
// FinalizerDaemon:处理 Finalizer 机制
FinalizerDaemon.INSTANCE.start();
FinalizerWatchdogDaemon.INSTANCE.start();
HeapTaskDaemon.INSTANCE.start();
}
ReferenceQueueDaemon 线程会使用等待唤醒机制轮询消费这个全局链表 unenqueued,如果链表不为空则将引用对象投递到对应的引用队列中,否则线程会进入等待。Daemons.java
private static class ReferenceQueueDaemon extends Daemon {
private static final ReferenceQueueDaemon INSTANCE = new ReferenceQueueDaemon();
ReferenceQueueDaemon() {
super("ReferenceQueueDaemon");
}
// 阶段 2:轮询 unenqueued 全局链表
@Override public void runInternal() {
while (isRunning()) {
Reference<?> list;
// 2.1 同步块
synchronized (ReferenceQueue.class) {
// 2.2 检查 unenqueued 全局链表是否为空
while (ReferenceQueue.unenqueued == null) {
// 2.3 为空则等待 ReferenceQueue.class 类锁
ReferenceQueue.class.wait();
}
list = ReferenceQueue.unenqueued;
ReferenceQueue.unenqueued = null;
}
// 2.4 投递引用对象
// 为什么放在同步块之外:因为 list 已经从静态变量 unenqueued 剥离处理,不用担心其他线程会插入新的引用,所以可以放在 synchronized{} 块之外
ReferenceQueue.enqueuePending(list);
}
}
}
private static class FinalizerDaemon extends Daemon {
...
}
ReferenceQueue.java
// 2.4 投递引用对象
public static void enqueuePending(Reference<?> list) {
Reference<?> start = list;
do {
ReferenceQueue queue = list.queue;
if (queue == null) {
// 2.4.1 没有关联的引用队列,则不需要投递
Reference<?> next = list.pendingNext;
list.pendingNext = list;
list = next;
} else {
// 2.4.2 为了避免反复加锁,这里选择一次性投递相同引用队列的对象
synchronized (queue.lock) {
do {
Reference<?> next = list.pendingNext;
list.pendingNext = list;
// 2.4.3 引用对象入队
queue.enqueueLocked(list);
list = next;
} while (list != start && list.queue == queue);
// 2.4.4 唤醒 queue.lock,跟 remove(...) 有关
queue.lock.notifyAll();
}
}
} while (list != start);
}
至此,引用对象已经加入 ReferenceQueue 中的双向链表,等待消费者调用 ReferenceQueue#poll() 消费引用对象。
使用一张示意图概括整个过程:

现在,我们回过头来详细分析 阶段 1 中的执行过程:ART 虚拟机存在多种垃圾收集算法,我们以 CMS 并发标记清除算法为例进行分析。先简单回顾下 CMS 并发标记清除算法分为 4 个阶段:
源码摘要如下:
mark_sweep.cc[5]
void MarkSweep::RunPhases() {
// 1、初始标记(只处理 GC Root 直接引用的对象)
MarkRoots(self);
// 2、并发标记(基于初始标记记录的可达对象)
MarkReachableObjects();
// 3.1 重标记(只处理 GC Root 直接引用的对象)
ReMarkRoots();
// 3.2 重标记(只处理并发标记记录的脏对象)
RecursiveMarkDirtyObjects(true/* 是否暂停 */, ...);
// 4. 并发清除
ReclaimPhase();
}
标记阶段: 在垃圾收集的并发标记阶段,会从 GC Root 进行递归遍历。每次找到一个引用类型对象,并且其指向的实际对象没有被标记(说明该对象除了被引用对象引用之外已经不存在其他引用关系),那么将该引用对象加入到 ReferenceProcessor 中对应的临时队列中。
方法调用链:
MarkReachableObjects→RecursiveMark→ProcessMarkStack→ScanObject→DelayReferenceReferentVisitor#operator→DelayReferenceReferent→ReferenceProcessor::DelayReferenceReferent
reference_processor.cc[6]
void ReferenceProcessor::DelayReferenceReferent(ObjPtr<mirror::Class> klass,
ObjPtr<mirror::Reference> ref,
collector::GarbageCollector* collector) {
mirror::HeapReference<mirror::Object>* referent = ref->GetReferentReferenceAddr();
// IsNullOrMarkedHeapReference:判断引用指向的实际对象是否被标记
if (!collector->IsNullOrMarkedHeapReference(referent, /*do_atomic_update*/true)) {
Thread* self = Thread::Current();
// 不同引用类型分别加入不同的队列中
if (klass->IsSoftReferenceClass()) {
// 软引用待处理队列
soft_reference_queue_.AtomicEnqueueIfNotEnqueued(self, ref);
} else if (klass->IsWeakReferenceClass()) {
// 弱引用待处理队列
weak_reference_queue_.AtomicEnqueueIfNotEnqueued(self, ref);
} else if (klass->IsFinalizerReferenceClass()) {
// Fianlizer 引用待处理队列
finalizer_reference_queue_.AtomicEnqueueIfNotEnqueued(self, ref);
} else if (klass->IsPhantomReferenceClass()) {
// 虚引用待处理队列
phantom_reference_queue_.AtomicEnqueueIfNotEnqueued(self, ref);
}
}
}
清理阶段: 在垃圾收集器清理阶段,依次处理临时队列中的引用对象,解除引用对象与实际对象的关联关系,所有解绑的引用对象都会被记录到另一个临时队列 cleared_references_ 中。
方法调用链:
ReclaimPhase→ProcessReferences→ReferenceProcessor::ProcessReferences→ReferenceQueue#ClearWhiteReferences
reference_processor.cc[7]
// Process reference class instances and schedule finalizations.
void ReferenceProcessor::ProcessReferences(bool concurrent,
TimingLogger* timings,
bool clear_soft_references,
collector::GarbageCollector* collector) {
...
// 软引用
soft_reference_queue_.ClearWhiteReferences(&cleared_references_, collector);
// 弱引用
weak_reference_queue_.ClearWhiteReferences(&cleared_references_, collector);
// FinalizeReference(EnqueueFinalizerReferences 在下篇文章分析)
finalizer_reference_queue_.EnqueueFinalizerReferences(&cleared_references_, collector);
// 虚引用
phantom_reference_queue_.ClearWhiteReferences(&cleared_references_, collector);
}
reference_queue.cc[8]
void ReferenceQueue::ClearWhiteReferences(ReferenceQueue* cleared_references,
collector::GarbageCollector* collector) {
while (!IsEmpty()) {
ObjPtr<mirror::Reference> ref = DequeuePendingReference();
mirror::HeapReference<mirror::Object>* referent_addr = ref->GetReferentReferenceAddr();
// IsNullOrMarkedHeapReference:判断引用指向的实际对象是否被标记
if (!collector->IsNullOrMarkedHeapReference(referent_addr, /*do_atomic_update*/false)) {
// 解除引用关系
ref->ClearReferent<false>();
// 加入另一个临时队列 cleared_references_
cleared_references->EnqueueReference(ref);
}
DisableReadBarrierForReference(ref);
}
}
回收对象后: 在实际对象被回收后,调用最终会将临时队列 cleared_references 传递到 Java 层的静态方法 ReferenceQueue#add(),从而存储到 Java 层的 unenqueued 变量中,之后就是交给 ReferenceQueueDaemon 线程处理。
方法调用链:
Heap::CollectGarbageInternal→ReferenceProcessor#EnqueueClearedReferences→ ClearedReferenceTask#Run
reference_processor.cc[9]
class ClearedReferenceTask : public HeapTask {
public:
explicit ClearedReferenceTask(jobject cleared_references) : HeapTask(NanoTime()), cleared_references_(cleared_references) {
}
virtual void Run(Thread* thread) {
ScopedObjectAccess soa(thread);
jvalue args[1];
// 调用 Java 层 ReferenceQueue#add 方法
args[0].l = cleared_references_;
InvokeWithJValues(soa, nullptr, WellKnownClasses::java_lang_ref_ReferenceQueue_add, args);
soa.Env()->DeleteGlobalRef(cleared_references_);
}
private:
const jobject cleared_references_;
};
至此,阶段 1 分析完毕。
为了实现对象的 Finalizer 机制,虚拟机设计了 FinalizerReference 引用类型,FinalizeReference 引用的处理过程与其他引用类型是相同的。主要区别在于 阶段 1 中解除引用对象与实际对象的关联关系后,会把实际对象暂存到 FinalizeReference 的 zombie 字段中。阶段 2 的处理是完全相同的,ReferenceQueueDaemon 线程会将 FinalizeReference 投递到关联的引用对象中。随后,守护线程 FinalizerDaemon 会轮询观察引用队列,并执行实际对象上的 finalize() 方法。
更多内容分析,见 Finalizer 机制
小结以下引用管理中最主要的环节:
unenqueued 队列;ReferenceQueueDaemon 会轮询 unenqueued 队列,将引用对象分别投递到关联的引用队列中;FinalizerDaemon 会轮询观察引用队列,并执行实际对象上的 finalize() 方法。使用一张示意图概括整个过程:

下一篇文章里,我们将更深入地分析 Java Finalizer 机制的实现原理,以及分析 Finalizer 存在的问题。例如为什么 Finalizer 机制是不稳定和危险的。
执着于理想,纯粹于当下。
[1]
GitHub · AndroidFamily: https://github.com/pengxurui/Android-NoteBook
[2]
java_lang_ref_Reference.cc: http://androidxref.com/9.0.0_r3/xref/art/runtime/native/java_lang_ref_Reference.cc
[3]
runtime.cc: https://www.androidos.net.cn/android/9.0.0_r8/xref/art/runtime/runtime.cc
[4]
Daemons.java: https://www.androidos.net.cn/android/9.0.0_r8/xref/libcore/libart/src/main/java/java/lang/Daemons.java
[5]
mark_sweep.cc: http://androidxref.com/9.0.0_r3/xref/art/runtime/gc/collector/mark_sweep.cc
[6]
reference_processor.cc: http://androidxref.com/9.0.0_r3/xref/art/runtime/gc/reference_processor.cc#GetReferent
[7]
reference_processor.cc: http://androidxref.com/9.0.0_r3/xref/art/runtime/gc/reference_processor.cc#GetReferent
[8]
reference_queue.cc: http://androidxref.com/9.0.0_r3/xref/art/runtime/gc/reference_queue.cc
[9]
reference_processor.cc: http://androidxref.com/9.0.0_r3/xref/art/runtime/gc/reference_processor.cc#251
[10]
Effective Java(第 3 版)(8. 避免使用 Finalizer 和 Cleanr 机制): https://www.cnblogs.com/IcanFixIt/p/8133798.html
[11]
深入理解 Android:Java 虚拟机 ART(第 14 章 · ART 中的 GC): https://weread.qq.com/web/reader/3ee32e60717f5af83ee7b37k5b832ac0313d5b8add2af21
[12]
深入理解 Java 虚拟机(第 3 版)(第 3 章 · 垃圾收集器与内存分配策略): https://weread.qq.com/web/reader/9b832f305933f09b86bd2a9k16732dc0161679091c5aeb1