并发工具类Phaser
阅读原文时间:2023年08月11日阅读:5

前言

在面试这一篇我们介绍过CountDownLatch和CyclicBarrier,它们都是jdk1.5提供的多线程并发控制类,内部都是用AQS这个同步框架实现。

在我们的实际项目中,有很多场景是需要从数据库查询一批数据,多线池执行某些操作,并且要统计结果,我们对这个过程做了一些封装,由于要统计结果,所以需要等所有任务都处理完成,我们用到了CountDownLatch实现同步。伪代码如下:

        ExecuteInstance ei = ExecuteInstance.build(myExecutor); //线程池

        //循环
        LoopShutdown.build("myTask").loop(() -> {

            //不断从数据获取数据
            List<Task> list = getFromDb();

            //设置countdownlatch
          ei.setCountDownSize(list.size());

        list.forEach(item -> ei.execute(() -> {
        //提交到线程池执行,并且统计
        }));

            //等待这一批做完
        ei.await();

    });

        //内部使用了CountDownLatch await()
    return ei.awaitResult();

代码很简单,容易理解。不过后来有同学提到每次都要setCountDownSize() + await() 这套组合太麻烦,能不能省略这两步呢。另外也不够灵活,有些场景不能提前知道要处理的数据总数,例如从迭代器遍历数据,Iterator接口并没有size方法可以获取到总数。

那怎么实现这个功能呢?就是本篇要介绍的Phaser。

Phaser原理

Phaser类是jdk7提供的,可重用的,同步的,在功能上和CountDownLatch,CyclicBarrier类似,但更加灵活的类。

"phaser" google翻译一下是:"移相器"的意思,完全不知道是什么~,不过"phase"是阶段的意思,还是能从名字了解到一些信息。

Phaser运行机制:

  • Registration(注册)

    跟其他barrier不同,在phaser上注册的parties会随着时间的变化而变化。任务可以随时注册(使用方法register,bulkRegister注册,或者由构造器确定初始parties),并且在任何抵达点可以随意地撤销注册(方法arriveAndDeregister)。就像大多数基本的同步结构一样,注册和撤销只影响内部计数;不会创建更深的内部记录,所以任务不能查询他们是否已经注册。(不过,可以通过继承来实现类似的记录)

    可以动态的注册是它的特点之一,我们知道CountDownLatch之类的在开始就需要指定一个计数,并且不能更改,而Phaser可以开始指定,也可以运行时更改。

  • Synchronization(同步机制)

    和CyclicBarrier一样,Phaser也可以重复await。方法arriveAndAwaitAdvance的效果类似CyclicBarrier.await。phaser的每一代都有一个相关的phase number,初始值为0,当所有注册的任务都到达phaser时phase+1,到达最大值(Integer.MAX_VALUE)之后清零。使用phase number可以独立控制到达phaser和等待其他线程的动作,通过下面两种类型的方法:

    Arrival(到达机制) arrive和arriveAndDeregister方法记录到达状态。这些方法不会阻塞,但是会返回一个相关的arrival phase number;也就是说,phase number用来确定到达状态。当所有任务都到达给定phase时,可以执行一个可选的函数,这个函数通过重写onAdvance方法实现,通常可以用来控制终止状态。重写此方法类似于为CyclicBarrier提供一个barrierAction,但比它更灵活。

    Waiting(等待机制) awaitAdvance方法需要一个表示arrival phase number的参数,并且在phaser前进到与给定phase不同的phase时返回。和CyclicBarrier不同,即使等待线程已经被中断,awaitAdvance方法也会一直等待。中断状态和超时时间同样可用,但是当任务等待中断或超时后未改变phaser的状态时会遭遇异常。如果有必要,在方法forceTermination之后可以执行这些异常的相关的handler进行恢复操作,Phaser也可能被ForkJoinPool中的任务使用,这样在其他任务阻塞等待一个phase时可以保证足够的并行度来执行任务。

  • Termination(终止机制)

    可以用isTerminated方法检查phaser的终止状态。在终止时,所有同步方法立刻返回一个负值。在终止时尝试注册也没有效果。当调用onAdvance返回true时Termination被触发。当deregistration操作使已注册的parties变为0时,onAdvance的默认实现就会返回true。也可以重写onAdvance方法来定义终止动作。forceTermination方法也可以释放等待线程并且允许它们终止。

  • Tiering(分层结构)

    Phaser支持分层结构(树状构造)来减少竞争。注册了大量parties的Phaser可能会因为同步竞争消耗很高的成本, 因此可以设置一些子Phaser来共享一个通用的parent。这样的话即使每个操作消耗了更多的开销,但是会提高整体吞吐量。在一个分层结构的phaser里,子节点phaser的注册和取消注册都通过父节点管理。子节点phaser通过构造或方法register、bulkRegister进行首次注册时,在其父节点上注册。子节点phaser通过调用arriveAndDeregister进行最后一次取消注册时,也在其父节点上取消注册。

    这也是它的主要亮点之一,这一点很像ConcurrentHashMap(对HashTable)和LongAdder(对AtomicLong),通过分散热点来降低资源竞争,提升并发效率。

  • Monitoring(状态监控)

    由于同步方法可能只被已注册的parties调用,所以phaser的当前状态也可能被任何调用者监控。在任何时候,可以通过getRegisteredParties获取parties数,其中getArrivedParties方法返回已经到达当前phase的parties数。当剩余的parties(通过方法getUnarrivedParties获取)到达时,phase进入下一代。这些方法返回的值可能只表示短暂的状态,所以一般来说在同步结构里并没有啥卵用。

CountDownLatch和CyclicBarrier都非常简单,从Phaser提供的api数量就可以看出为什么说它更加灵活,show me the code,接下来我们通过几个例子感受一下。

Phaser例子

例子1:子线程会等全部子线程达到后才开始执行,实现类似CyclicBarrier的效果。

    @Test
    public void test1() throws InterruptedException {
        List<Runnable> list = Lists.newArrayList();
        for (int i = 0; i < 10; i++) {
            final int j = i;
            list.add(() -> System.out.println(j));
        }

        final Phaser phaser = new Phaser(); // "1" to register self
        // create and start threads
        int i = 0;
        for (final Runnable task : list) {
            i++;
            final int j = i;
            phaser.register();
            new Thread(() -> {
                try {
                    Thread.sleep(j * 1000);
                } catch (InterruptedException e) {
                }
                //全部子线程到达后才开始执行
                phaser.arriveAndAwaitAdvance(); // await all creation
                task.run();
            }).start();
        }
        Thread.sleep(15000);
    }

例子2:task会循环做3次,通过重写onAdvance可以控制phaser结束的条件。

        @Test
    public void test2() throws InterruptedException {
        //重复做3次
        int iterations = 3;
        List<Runnable> list = Lists.newArrayList();
        for (int i = 0; i < 2; i++) {
            final int j = i;
            list.add(() -> System.out.println(j));
        }

        final Phaser phaser = new Phaser() {
            //每做一次,phase+1,该方法返回true,就会结束
            protected boolean onAdvance(int phase, int registeredParties) {
                return phase > iterations || registeredParties == 0;
            }
        };
        phaser.register();
        for (final Runnable task : list) {
            phaser.register();
            new Thread(() -> {
                do {
                    task.run();
                    phaser.arriveAndAwaitAdvance();
                } while (!phaser.isTerminated());
            }).start();
        }
        phaser.arriveAndDeregister(); // deregister self, don't wait
        Thread.sleep(5000);
    }

例子3:创建多个phaser,并关联到父phaser上,就是上面提到的分层结构。

        @Test
    public void test3() {
        Phaser parent = new Phaser(1);
        Phaser phaser1 = new Phaser(parent);
        Phaser phaser2 = new Phaser(parent);

        for (int i = 0; i < 20; i++) {
            final int j = i;
            if (i < 10) {
                phaser1.register();
                new Thread(() -> {
                    try {
                        Thread.sleep(1000);
                        phaser1.arriveAndAwaitAdvance(); // await all creation
                        System.out.println(j);
                    } catch (InterruptedException e) {
                    }
                }).start();
            } else if (i < 20) {
                phaser2.register();
                new Thread(() -> {
                    try {
                        Thread.sleep(10000);
                        phaser2.arriveAndAwaitAdvance(); // await all creation
                        System.out.println(j);
                    } catch (InterruptedException e) {
                    }
                }).start();
            }
        }
        parent.arriveAndAwaitAdvance();
        System.out.println("done");
    }

例子4:使用Phaser改写我们的代码,如下:

        //维护一个Phaser
    public static ExecuteInstance buildWithPhaser(Executor executor) {
        ExecuteInstance ei = new ExecuteInstance();
            ei.executor = executor;
        ei.phaser = new Phaser(1);
        return ei;
    }

        //提交线程池前注册一下
        public void executeRR(Callable<ReturnResult> task, Consumer<Exception> exceptionHandler, int batch) {
        phaser.register();
        executor.execute(() -> executeStatistics(task, exceptionHandler, batch));
    }

        //执行后deregister一下
        private void executeStatistics(Callable<ReturnResult> task, Consumer<Exception> exceptionHandler, int batch) {
        ReturnResult result = ReturnResult.NONE;
        try {
                    //任务处理
            result = task.call();
        } catch (Exception e) {
            if (statistics) {
                counter.incrException(batch);
            }
            if (exceptionHandler != null) {
                //自定义异常处理
                try {
                    exceptionHandler.accept(e);
                } catch (Exception he) {
                }
            }
        } finally {
            phaser.arriveAndDeregister(); //deregister
            if (statistics) {
                if (ReturnResult.SUCCESS.equals(result)) {
                    counter.incrSuccess(batch);
                } else if (ReturnResult.FAIL.equals(result)) {
                    counter.incrFail(batch);
                } else if (ReturnResult.FILTER.equals(result)) {
                    counter.incrFilter(batch);
                }
            }
        }
    }

        //等待结果
        public ExecuteResult awaitResult() {
        phaser.arriveAndAwaitAdvance();
        return getExecuteResult();
        }

使用就非常简单了

    ExecuteInstance ei = ExecuteInstance.buildWithPhaser(myExecutor); //线程池

        //循环
         LoopShutdown.build("myTask").loop(() -> {

            //不断从数据获取数据
            List<Task> list = getFromDb();            

        list.forEach(item -> ei.execute(() -> {
            //提交到线程池执行,并且统计
        }));
    });

    return ei.awaitResult();

总结

Phaser是jkd7后提供的同步工具类,它底层并没有使用AQS同步工具。相比CountDownLatch等它提供了更丰富的功能,但也意味着它更复杂,需要更多的资源,一些简单的场景CountDownLatch等工具类能满足的就使用它们即可,考虑性能,还有灵活性时才考虑使用Phaser,如笔者的场景使用Phaser就更加适合。

更多分享,欢迎关注我的github:https://github.com/jmilktea/jtea