前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >forkjoin并发分页查数据_java fork join

forkjoin并发分页查数据_java fork join

作者头像
全栈程序员站长
发布2022-11-04 16:07:52
3790
发布2022-11-04 16:07:52
举报
文章被收录于专栏:全栈程序员必看

大家好,又见面了,我是你们的朋友全栈君。

为什么用 Fork/Join ?

对于简单的并行任务,你可以通过“线程池+Future”的方案来解决;如果任务之间有聚合关系,无论是AND聚合还是OR聚合,都可以通过CompletableFuture来解决;而批量的并行任务,则可以通过CompletionService来解决。这几种方案基本上能够覆盖日常工作中的并发场景了,但还是不够全面,因为还有一种“分治”的任务模型没有覆盖到。

分治,顾名思义,即分而治之,是一种解决复杂问题的思维方法和模式;具体来讲,指的是把一个复杂的问题分解成多个相似的子问题,然后再把子问题分 解成更小的子问题,直到子问题简单到可以直接求解。

forkjoin并发分页查数据_java fork join
forkjoin并发分页查数据_java fork join

Java并发包里提供了一种叫做Fork/Join的并行计算框架,就是用来支持分治这种任务模型的。

如何用Fork/Join 并行计算框架计算斐波那契数列

f(n)=f(n-1)+f(n-2)

代码语言:javascript
复制
import java.util.concurrent.ForkJoinPool;
import java.util.concurrent.RecursiveTask;
public class forkjoin {
    public static void main(String[] args) {
        //创建分治任务线程池
        ForkJoinPool fjp = new	ForkJoinPool(4);
        //创建分治任务
        Fibonacci fib = new	Fibonacci(30);
        //启动分治任务
        Long start_time = System.currentTimeMillis();
        Integer	result = fjp.invoke(fib);
        //输出结果
        Long end_time = System.currentTimeMillis();
        Long compute_time = end_time - start_time;
        System.out.println("result: "+result);
        System.out.println("forkjoin compute_time: "+ compute_time);
    }
    //递归任务
    static class Fibonacci extends RecursiveTask<Integer>{
        final	int	n;
        Fibonacci(int	n){this.n	=	n;}
        protected	Integer	compute(){
            if(n<=1) 
                return n;
            Fibonacci f1 = new Fibonacci(n-1);
            //创建⼦任务
            f1.fork();
            Fibonacci f2 = new Fibonacci(n-2);
            //等待⼦任务结果,并合并结果
            return f2.compute()+f1.join();
        }
    }
}

普通单线程计算斐波那契数列

代码语言:javascript
复制
public class fibonacci {
    public static void main(String[] args) {
        Fibonacci fib = new	Fibonacci(30);
        Long start_time = System.currentTimeMillis();
        Integer	result = fib.compute();
        Long end_time = System.currentTimeMillis();
        Long compute_time = end_time - start_time;
        System.out.println("result: "+result);
        System.out.println("compute_time: "+ compute_time);
    }
    //递归任务
    static class Fibonacci {
        final int n;
        Fibonacci(int n){
            this.n = n;
        }
        protected	Integer	compute(){
            //终止条件
            if(n<=1)
                return	n;
            //创建⼦任务
            Fibonacci f1 = new	Fibonacci(n-1);
            Fibonacci f2 = new	Fibonacci(n-2);
            //等待⼦任务结果,并合并结果
            return f2.compute()+f1.compute();
        }
    }
}

分别执行,会发现普通计算的方式会更快,说明forkjoin在调度方面会有很大的性能消耗。

在终止条件下加上一条休眠语句,使每次计算都要持续设定时间以上,再对比两种方式的速度。

代码语言:javascript
复制
 Fibonacci fib = new	Fibonacci(5);

 //终止条件
if(n<=1) {
    if(n<=1) {
         try {
              Thread.sleep(1000);
         }catch (Exception e){
              e.printStackTrace();
         }
         return n;
     }
}

可以发现并行的计算方式的执行速度,与设定的的线程数量有关,比如第五个斐波那契数列的值,需要分解为8次计算任务,每次至少需要8秒。普通计算方式需要8秒,并行计算方式在线程数为4的情况下,执行时间为2秒;线程数为8的情况下,执行时间为1秒。实际执行速度应与CPU的核数有关,即如果CPU只有4核,就算设置为8线程,最快速度也只有2秒(示例中执行时间为1秒是因为采用线程休眠来模拟该线程的总处理时间,实际该线程在休眠期间并不消耗计算资源)

使用Fork/Join需要注意的地方

在使用Fork/Join时,需要注意出现工作线程不工作的事情。下面从不同的使用方式来分析: fork() 和 compute()

在示例中,下面这句语句是分解任务以及合并任务的关键

代码语言:javascript
复制
 f1.fork();
//等待⼦任务结果,并合并结果
return f2.compute()+f1.join();

主线程分配了一个任务给子线程,同时自己也执行一次计算任务。

方式1: a.fork(); b.fork(); b.join(); a.join();

代码语言:javascript
复制
f1.fork();
f2.fork();
return f2.join()+f1.join();

这种使用方式内部做了很多优化,目的都是为了避免出现工作线程只分配任务而不执行任务的情况。

方式2:invokeAll(a,b)

代码语言:javascript
复制
invokeAll(f1, f2);
return f2.join()+f1.join();

invokeAll的N个任务中,其中N-1个任务会使用fork()交给其它线程执行,但是,它还会留一个任务自己执行,这样,就充分利用了线程池,保证没有空闲的不干活的线程。

方式3:a.fork(); b.fork(); a.join(); b.join(); (错误的使用方式,不建议使用)

代码语言:javascript
复制
f1.fork();
f2.fork();
return f1.join()+f2.join();

这种使用方式会出现工作线程只分配任务给子线程,自己却不执行任务的情况。比如某个任务可以分为四个子任务,线程a把任务分给线程b线程c,而线程b线程c又继续分给自己的子线程(b分解为b1和b2 / c分解为c1和c2),总共需要7个线程,但是abc却不参与计算。而第一种使用方法,Java内部做了优化。

总结

用两次fork()在join的时候,需要用这样的顺序:a.fork(); b.fork(); b.join(); a.join();这个要求在JDK官方文档里有说明。

建议使用fork() 和 compute() ,这样可以避免避免性能问题,且更容易理解。该用法可理解为在主线程中使用fork分解一次任务,同时该线程执行一次compute 计算,如果该compute计算还需要分解任务,则继续fork() 和 compute(),直到满足终止条件直接返回。因此主线程会不断分解任务,直到任务无法分解并计算该任务返回计算结果。即主线程的处理任务是分解n/2 次任务以及执行一次无法分解的任务。

参考 :

https://www.liaoxuefeng.com/article/001493522711597674607c7f4f346628a76145477e2ff82000

https://time.geekbang.org/discuss/detail/90130/

forkjoin并发分页查数据_java fork join
forkjoin并发分页查数据_java fork join

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022年9月16日 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 为什么用 Fork/Join ?
  • 如何用Fork/Join 并行计算框架计算斐波那契数列
  • 使用Fork/Join需要注意的地方
相关产品与服务
GPU 云服务器
GPU 云服务器(Cloud GPU Service,GPU)是提供 GPU 算力的弹性计算服务,具有超强的并行计算能力,作为 IaaS 层的尖兵利器,服务于生成式AI,自动驾驶,深度学习训练、科学计算、图形图像处理、视频编解码等场景。腾讯云随时提供触手可得的算力,有效缓解您的计算压力,提升业务效率与竞争力。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档