死磕Java并发:J.U.C之AQS:同步状态的获取与释放
此篇博客所有源码均来自JDK 1.8
在前面提到过,AQS 是构建 Java 同步组件的基础,我们期待它能够成为实现大部分同步需求的基础。
AQS 的设计模式采用的模板方法模式,子类通过继承的方式,实现它的抽象方法来管理同步状态。对于子类而言,它并没有太多的活要做,AQS 已经提供了大量的模板方法来实现同步,主要是分为三类:
独占式获取和释放同步状态
共享式获取和释放同步状态
查询同步队列中的等待线程情况。
自定义子类使用 AQS 提供的模板方法,就可以实现自己的同步语义。
1. 独占式
独占式,同一时刻,仅有一个线程持有同步状态。
1.1 独占式同步状态获取
老艿艿:「1.1 独占式同步状态获取」整个小节,是本文最难的部分。请一定保持耐心。
#acquire(int arg)方法,为 AQS 提供的模板方法。该方法为独占式获取同步状态,但是该方法对中断不敏感。也就是说,由于线程获取同步状态失败而加入到 CLH 同步队列中,后续对该线程进行中断操作时,线程不会从 CLH 同步队列中移除。代码如下:
1: public final void acquire(int arg) {
2: if (!tryAcquire(arg) &&
3: acquireQueued(addWaiter(Node.EXCLUSIVE), arg))
4: selfInterrupt();
5: }
第 2 行:调用#tryAcquire(int arg)方法,去尝试获取同步状态,获取成功则设置锁状态并返回 true ,否则获取失败,返回 false 。若获取成功,#acquire(int arg)方法,直接返回,不用线程阻塞,自旋直到获得同步状态成功。
#tryAcquire(int arg)方法,需要自定义同步组件自己实现,该方法必须要保证线程安全的获取同步状态。代码如下:
protected boolean tryAcquire(int arg) {
throw new UnsupportedOperationException();
}
直接抛出 UnsupportedOperationException 异常。
第 3 行:如果#tryAcquire(int arg)方法返回 false ,即获取同步状态失败,则调用#addWaiter(Node mode)方法,将当前线程加入到 CLH 同步队列尾部。并且,mode方法参数为Node.EXCLUSIVE,表示独占模式。
第 3 行:调用boolean #acquireQueued(Node node, int arg)方法,自旋直到获得同步状态成功。详细解析,见「1.1.1 acquireQueued」中。另外,该方法的返回值类型为boolean,当返回 true 时,表示在这个过程中,发生过线程中断。但是呢,这个方法又会清理线程中断的标识,所以在种情况下,需要调用【第 4 行】的#selfInterrupt()方法,恢复线程中断的标识,代码如下:
static void selfInterrupt() {
Thread.currentThread().interrupt();
}
1.1.1 acquireQueued
boolean #acquireQueued(Node node, int arg)方法,为一个自旋的过程,也就是说,当前线程(Node)进入同步队列后,就会进入一个自旋的过程,每个节点都会自省地观察,当条件满足,获取到同步状态后,就可以从这个自旋过程中退出,否则会一直执行下去。
流程图如下:
代码如下:
1: final boolean acquireQueued(final Node node, int arg) {
2: // 记录是否获取同步状态成功
3: boolean failed = true;
4: try {
5: // 记录过程中,是否发生线程中断
6: boolean interrupted = false;
7: /
8: 自旋过程,其实就是一个死循环而已
9: */
10: for (;;) {
11: // 当前线程的前驱节点
12: final Node p = node.predecessor();
13: // 当前线程的前驱节点是头结点,且同步状态成功
14: if (p == head && tryAcquire(arg)) {
15: setHead(node);
16: p.next = null; // help GC
17: failed = false;
18: return interrupted;
19: }
20: // 获取失败,线程等待–具体后面介绍
21: if (shouldParkAfterFailedAcquire(p, node) &&
22: parkAndCheckInterrupt())
23: interrupted = true;
24: }
25: } finally {
26: // 获取同步状态发生异常,取消获取。
27: if (failed)
28: cancelAcquire(node);
29: }
30: }
第 3 行:failed变量,记录是否获取同步状态成功。
第 6 行:interrupted变量,记录获取过程中,是否发生线程中断。
========== 第 7 至 24 行:“死”循环,自旋直到获得同步状态成功。==========
第 12 行:调用Node#predecessor()方法,获得当前线程的前一个节点p。
第 14 行:p == head代码块,若满足,则表示当前线程的前一个节点为头节点,因为head是最后一个获得同步状态成功的节点,此时调用#tryAcquire(int arg)方法,尝试获得同步状态。 在#acquire(int arg)方法的【第 2 行】,也调用了这个方法。
第 15 至 18 行:当前节点( 线程 )获取同步状态成功:
第 15 行:设置当前节点( 线程 )为新的head。
第 16 行:设置老的头节点p不再指向下一个节点,让它自身更快的被 GC 。
第 17 行:标记failed = false,表示获取同步状态成功。
第 18 行:返回记录获取过程中,是否发生线程中断。
第 20 至 24 行:获取失败,线程等待唤醒,从而进行下一次的同步状态获取的尝试。详细解析,见《【死磕 Java 并发】—– J.U.C 之 AQS:阻塞和唤醒线程》。详细解析,见「1.1.2 shouldParkAfterFailedAcquire」。
第 21 行:调用#shouldParkAfterFailedAcquire(Node pre, Node node)方法,判断获取失败后,是否当前线程需要阻塞等待。
========== 第 26 至 29 行:获取同步状态的过程中,发生异常,取消获取。==========
第 28 行:调用#cancelAcquire(Node node)方法,取消获取同步状态。详细解析,见「1.1.3 cancelAcquire」。
1.1.2 shouldParkAfterFailedAcquire
1: private static boolean shouldParkAfterFailedAcquire(Node pred, Node node) {
2: // 获得前一个节点的等待状态
3: int ws = pred.waitStatus;
4: if (ws == Node.SIGNAL) // Node.SIGNAL
5: /
6: This node has already set status asking a release
7: * to signal it, so it can safely park.
8: /
9: return true;
10: if (ws > 0) { // Node.CANCEL
11: /
12: * Predecessor was cancelled. Skip over predecessors and
13: * indicate retry.
14: /
15: do {
16: node.prev = pred = pred.prev;
17: } while (pred.waitStatus > 0);
18: pred.next = node;
19: } else { // 0 或者 Node.PROPAGATE
20: /
21: * waitStatus must be 0 or PROPAGATE. Indicate that we
22: * need a signal, but don’t park yet. Caller will need to
23: * retry to make sure it cannot acquire before parking.
24: */
25: compareAndSetWaitStatus(pred, ws, Node.SIGNAL);
26: }
27: return false;
28: }
pred和node方法参数,传入时,要求前者必须是后者的前一个节点。
第 3 行:获得前一个节点(pre)的等待状态。下面会根据这个状态有三种情况的处理。
第 4 至 9 行:等待状态为Node.SIGNAL时,表示pred的下一个节点node的线程需要阻塞等待。在pred的线程释放同步状态时,会对node的线程进行唤醒通知。所以,【第 9 行】返回 true ,表明当前线程可以被park,安全的阻塞等待。
第 19 至 26 行:等待状态为0或者Node.PROPAGATE时,通过CAS设置,将状态修改为Node.SIGNAL,即下一次重新执行#shouldParkAfterFailedAcquire(Node pred, Node node)方法时,满足【第 4 至 9 行】的条件。
但是,对于本次执行,【第 27 行】返回 false 。
另外,等待状态不会为Node.CONDITION,因为它用在 ConditonObject 中。
第 10 至 18 行:等待状态为NODE.CANCELLED时,则表明该线程的前一个节点已经等待超时或者被中断了,则需要从 CLH 队列中将该前一个节点删除掉,循环回溯,直到前一个节点状态<= 0。
对于本次执行,【第 27 行】返回 false ,需要下一次再重新执行#shouldParkAfterFailedAcquire(Node pred, Node node)方法,看看满足哪个条件。
整个过程如下图:
1.1.3 cancelAcquire
1: private void cancelAcquire(Node node) {
2: // Ignore if node doesn’t exist
3: if (node == null)
4: return;
5:
6: node.thread = null;
7:
8: // Skip cancelled predecessors
9: Node pred = node.prev;
10: while (pred.waitStatus > 0)
11: node.prev = pred = pred.prev;
12:
13: // predNext is the apparent node to unsplice. CASes below will
14: // fail if not, in which case, we lost race vs another cancel
15: // or signal, so no further action is necessary.
16: Node predNext = pred.next;
17:
18: // Can use unconditional write instead of CAS here.
19: // After this atomic step, other Nodes can skip past us.
20: // Before, we are free of interference from other threads.
21: node.waitStatus = Node.CANCELLED;
22:
23: // If we are the tail, remove ourselves.
24: if (node == tail && compareAndSetTail(node, pred)) {
25: compareAndSetNext(pred, predNext, null);
26: } else {
27: // If successor needs signal, try to set pred’s next-link
28: // so it will get one. Otherwise wake it up to propagate.
29: int ws;
30: if (pred != head &&
31: ((ws = pred.waitStatus) == Node.SIGNAL
第 2 至 4 行:忽略,若传入参数node为空。
第 6 行:将节点的等待线程置空。
第 9 行:获得node节点的前一个节点pred。
第 10 至 11 行: 逻辑同#shouldParkAfterFailedAcquire(Node pred, Node node)的【第 15 至 17 行】。
第 16 行:获得pred的下一个节点predNext。在这个变量上,有很“复杂”的英文,我们来理解下:predNext从表面上看,和node是等价的。
但是实际上,存在多线程并发的情况,所以在【第 25 行】或者【第 36 行】中,我们调用#compareAndSetNext(…)方法,使用CAS的方式,设置pred的下一个节点。
如果设置失败,说明当前线程和其它线程竞争失败,不需要做其它逻辑,因为pred的下一个节点已经被其它线程设置成功。
第 21 行:设置node节点的为取消的等待状态Node.CANCELLED。在这个变量上,有很“复杂”的英文,我们再来理解下:
这里可以使用直接写,而不是 CAS 。
在这个操作之后,其它 Node 节点可以忽略node。
Before, we are free of interference from other threads.TODO 9000 芋艿,如何理解。
下面开始开始修改pred的新的下一个节点,一共分成三种情况。
========== 第一种 ==========
第 24 行:如果node是尾节点,调用#compareAndSetTail(…)方法,CAS设置pred为新的尾节点。
第 25 行:若上述操作成功,调用#compareAndSetNext(…)方法,CAS设置pred的下一个节点为空(null)。
========== 第二种 ==========
第 30 行:pred非首节点。
第 31 至 32 行:pred的等待状态为Node.SIGNAL,或者可被CAS为Node.SIGNAL。
第 33 行:pred的线程非空。
TODO 9001 芋艿,如何理解。目前能想象到的,一开始 30 行为非头节点,在 33 的时候,结果成为头节点,线程已经为空了。
第 34 至 36 行:若node的下一个节点next的等待状态非Node.CANCELLED,则调用#compareAndSetNext(…)方法,
2: Node h = head; // Record old head for check below
3: setHead(node);
4: /*
5: * Try to signal next queued node if:
6: * Propagation was indicated by caller,
7: * or was recorded (as h.waitStatus either before
8: * or after setHead) by a previous operation
9: * (note: this uses sign-check of waitStatus because
10: * PROPAGATE status may transition to SIGNAL.)
11: * and
12: * The next node is waiting in shared mode,
13: * or we don’t know, because it appears null
14: *
15: * The conservatism in both of these checks may cause
16: * unnecessary wake-ups, but only when there are multiple
17: * racing acquires/releases, so most need signals now or soon
18: * anyway.
19: */
| 20: if (propagate > 0 | h == null | h.waitStatus < 0 |
| 21: (h = head) == null | h.waitStatus < 0) { |
22: Node s = node.next;
| 23: if (s == null | s.isShared()) |
24: doReleaseShared();
25: }
26: }
第 2 行:记录原来的首节点h。
第 3 行:调用#setHead(Node node)方法,设置node为新的首节点。
第 20 行:propagate > 0代码块,说明同步状态还能被其他线程获取。
第 20 至 21 行:判断原来的或者新的首节点,等待状态为Node.PROPAGATE或者Node.SIGNAL时,可以继续向下唤醒。
第 23 行:调用Node#isShared()方法,判断下一个节点为共享式获取同步状态。
第 24 行:调用#doReleaseShared()方法,唤醒后续的共享式获取同步状态的节点。详细解析,见「2.1.2 setHeadAndPropagate」。
2.2 共享式获取响应中断
#acquireSharedInterruptibly(int arg)方法,代码如下:
public final void acquireSharedInterruptibly(int arg)
throws InterruptedException {
if (Thread.interrupted())
throw new InterruptedException();
if (tryAcquireShared(arg) < 0)
doAcquireSharedInterruptibly(arg);
}
private void doAcquireSharedInterruptibly(int arg)
throws InterruptedException {
final Node node = addWaiter(Node.SHARED);
boolean failed = true;
try {
for (;;) {
final Node p = node.predecessor();
if (p == head) {
int r = tryAcquireShared(arg);
if (r >= 0) {
setHeadAndPropagate(node, r);
p.next = null; // help GC
failed = false;
return;
}
}
if (shouldParkAfterFailedAcquire(p, node) &&
parkAndCheckInterrupt())
throw new InterruptedException();
}
} finally {
if (failed)
cancelAcquire(node);
}
}
与「1.2 独占式获取响应中断」类似,就不重复解析了。
2.3 共享式超时获取
#tryAcquireSharedNanos(int arg, long nanosTimeout)方法,代码如下:
public final boolean tryAcquireSharedNanos(int arg, long nanosTimeout)
throws InterruptedException {
if (Thread.interrupted())
throw new InterruptedException();
return tryAcquireShared(arg) >= 0
与「1.3 独占式超时获取」类似,就不重复解析了。
2.4 共享式同步状态释放
当线程获取同步状态后,执行完相应逻辑后,就需要释放同步状态。AQS 提供了#releaseShared(int arg)方法,释放同步状态。代码如下:
1: public final boolean releaseShared(int arg) {
2: if (tryReleaseShared(arg)) {
3: doReleaseShared();
4: return true;
5: }
6: return false;
7: }
第 2 行:调用#tryReleaseShared(int arg)方法,去尝试释放同步状态,释放成功则设置锁状态并返回 true ,否则获取失败,返回 false 。同时,它们分别对应【第 3 至 5】和【第 6 行】的逻辑。
#tryReleaseShared(int arg)方法,需要自定义同步组件自己实现,该方法必须要保证线程安全的释放同步状态。代码如下:
protected boolean tryReleaseShared(int arg) {
throw new UnsupportedOperationException();
}
直接抛出 UnsupportedOperationException 异常。
第 3 行:调用#doReleaseShared()方法,唤醒后续的共享式获取同步状态的节点。
2.4.1 doReleaseShared
1: private void doReleaseShared() {
2: /
3: Ensure that a release propagates, even if there are other
4: * in-progress acquires/releases. This proceeds in the usual
5: * way of trying to unparkSuccessor of head if it needs
6: * signal. But if it does not, status is set to PROPAGATE to
7: * ensure that upon release, propagation continues.
8: * Additionally, we must loop in case a new node is added
9: * while we are doing this. Also, unlike other uses of
10: * unparkSuccessor, we need to know if CAS to reset status
11: * fails, if so rechecking.
12: */
13: for (;;) {
14: Node h = head;
15: if (h != null && h != tail) {
16: int ws = h.waitStatus;
17: if (ws == Node.SIGNAL) {
18: if (!compareAndSetWaitStatus(h, Node.SIGNAL, 0))
19: continue; // loop to recheck cases
20: unparkSuccessor(h);
21: }
22: else if (ws == 0 &&
23: !compareAndSetWaitStatus(h, 0, Node.PROPAGATE))
24: continue; // loop on failed CAS
25: }
26: if (h == head) // loop if head changed
27: break;
28: }
29: }
TODO 9003 doReleaseShared 的详细逻辑。可参考博客:http://zhanjindong.com/2015/03/15/java-concurrent-package-aqs-AbstractQueuedSynchronizer
参考资料
666. 彩蛋
如果你对 Java 并发感兴趣,欢迎加入我的知识星球一起交流。
AQS 的整体设计非常精巧,所以很多地方设计的很难理解。即使老艿艿基于小明哥的博客,并且 Google 了很多博客,发现自己还是无法透彻理解。同时,大量的博客,也没写清楚很多细节。膜拜大神 Doug Lea 的同时,不得不说有点苦闷,无法很干净的理解和描述 AQS 的实现。
Measure
Measure

