前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >成果被他人窃取_工作窃取模式

成果被他人窃取_工作窃取模式

作者头像
全栈程序员站长
发布2022-09-30 11:08:23
3250
发布2022-09-30 11:08:23
举报
文章被收录于专栏:全栈程序员必看

大家好,又见面了,我是你们的朋友全栈君

什么是ForkJoin、ForkJoin分支合并、ForkJoin工作窃取、ForkJoin大数据求和计算

什么是ForkJoin?

ForkJoin(分支合并)是jdk1.7之后出来的,并行执行任务,提高效率,用在大数据量场景下。

大数据:Map Reduce(把大任务拆分成多个小任务,怎么拆分用到了二分算法),每个小任务得出自己的结果,之后再把结果汇总,汇总的过程就是分支合并的思想。

ForkJoin:分支合并

ForkJoin会把一个大任务分成若干个小任务去执行(任务是双端队列去存储的,两端都可以操作),然后再合并结果集。

请添加图片描述
请添加图片描述

ForkJoin特点:工作窃取

ForkJoin会把一个大任务分成若干个小任务去执行(任务是双端队列去存储的,两端都可以操作),然后再合并结果集。 线程的执行速度不一样,因此先执行完的线程,为了避免浪费时间,会去还没有执行完的线程那里拿到它未执行完的任务,去帮它执行,之所以能拿到,也是因为任务是双端队列存储的,两头都可以操作。

ForkJoinPool主要是为了并行计算使用(也就是新增加的并行流),但我觉得更适合IO密集型的场景。 比如大规模的并行查询。而CPU密集型的操作,过多的线程切换可能会影响效率

请添加图片描述
请添加图片描述

如何让使用ForkJoin

  • 1.ForkJoinPool,通过ForkJoinPool来执行
  • 2.计算任务forkJoinPool.execute(ForkJoinTask task)
  • 3.计算类要继承ForkJoinTask(执行任务RecursiveTask:有返回值 RecursiveAction:无返回值)

Class ForkJoinPool有一个异步执行任务的方法

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

我们需要用到有返回值的RecursiveTask

使用RecursiveTask需要继承RecursiveTask,并定义返回值类型

代码语言:javascript
复制
class Fibonacci extends RecursiveTask<Integer>

ForkJoin求和计算Demo

代码语言:javascript
复制
import java.util.concurrent.*;
import java.util.stream.LongStream;
/** * 求和计算 * 1.最low的:循环求和 * 2.一般的:ForkJoin分支求和 * 3.最快的:Stream并行流求和 */
public class ForkJoinDemo { 

public static void main(String[] args) throws ExecutionException, InterruptedException { 

new ForkJoinDemo().test1();
new ForkJoinDemo().test2();
new ForkJoinDemo().test3();
/** * test1===>和为500000000500000000,耗时9937 * test2===>和为500000000500000000,耗时8622 * test3===>和为500000000500000000,耗时276 */
}
//1.最low的:循环求和
public void test1() { 

long start = System.currentTimeMillis();
Long sum = 0L;
for (Long i = 0L; i <= 10_0000_0000L; i++) { 

sum += i;
}
long end = System.currentTimeMillis();
System.out.println("test1===>和为" + sum + ",耗时" + (end - start));
}
//2.一般的:ForkJoin分支求和
public void test2() throws ExecutionException, InterruptedException { 

long start = System.currentTimeMillis();
// 也可以使用公用的线程池 ForkJoinPool.commonPool():
// pool = ForkJoinPool.commonPool()
ForkJoinPool pool = new ForkJoinPool();
ForkJoinTask<Long> task = pool.submit(new MySumForkJoin(0L, 10_0000_0000L));//提交任务
Long sum = task.get();
long end = System.currentTimeMillis();
System.out.println("test2===>和为" + sum + ",耗时" + (end - start));
}
//3.最快的:Stream并行流求和
public void test3() { 
//没有Long的拆箱装箱操作
long start = System.currentTimeMillis();
long sum = LongStream.rangeClosed(0L, 10_0000_0000L).parallel().reduce(0, Long::sum);//reduce第一个参数为0,为了保证,在进行流条件计算下,保证每次累计的值不受多线程影响
long end = System.currentTimeMillis();
System.out.println("test3===>和为" + sum + ",耗时" + (end - start));
}
}
/** * 如何让使用ForkJoin * 1.ForkJoinPool,通过ForkJoinPool来执行 * 2.计算任务forkJoinPool.execute(ForkJoinTask task) * 3.计算类要继承ForkJoinTask(执行任务RecursiveTask:有返回值 RecursiveAction:无返回值) */
class MySumForkJoin extends RecursiveTask<Long> { 

private Long start;//开始值
private Long end;//结束值
private Long criticalValue = 10000L;//临界值,超过这个值开始分任务执行
public MySumForkJoin(Long start, Long end) { 

this.start = start;
this.end = end;
}
//计算方法:递归调用的
@Override
protected Long compute() { 

if (end - start <= criticalValue) { 

Long sum = 0L;
for (Long i = start; i <= end; i++) { 

sum += i;
}
return sum;
} else { 
//ForkJoin执行分支合并计算,
// System.out.println("开始ForkJoin执行分支合并计算");
//1.先求中间值
Long middle = (start + end) / 2;//不直接(start+end)/2,防止溢出
/*把任务一分为二,递归拆分(注意此处有递归)到底拆分成多少分 需要根据具体情况而定*/
MySumForkJoin task1 = new MySumForkJoin(start, middle);
MySumForkJoin task2 = new MySumForkJoin(middle + 1, end);
// task1.fork();//拆分任务,把任务压入双端队列,这里手动只拆分成两个任务,可以拆分多个
// task2.fork();//拆分任务,把任务压入双端队列
invokeAll(task1, task2);//拆分任务,把任务压入双端队列
/** * compute分出多个task后:以task1,task2为例 * 错误做法: * 1)依次执行task1.fork(),task2.fork() * 2)依次执行task1.join(),task2.join() * 正确做法: * 1)直接调用invokeAll(task1,task2) * * fork(): * 把task置入当前ForkJoinWorkerThread的queue中,等待被消费 * join(): * 当前ForkJoinWorkerThread执行等待该task执行结束 * * 错误做法过程: * 将task1与task2置入queue中,当前ForkJoinWorkerThread停下来等待task1,task2的执行结束。 * * 分析: * 当前的ForkJoinWorkerThread可以说join之后什么事情都没有做,只是等待ing。而task1和task2会在新的线程中执行。 * 会浪费当前ForkJoinWorkerThread的宝贵线程资源。而且最糟糕的是,会创建一个新的ForkJoinWorkerThread去执行新的task,可想而知,如果任务量特别多,那会同时开启特别多的线程。 */
return task1.join() + task2.join();
}
}
}

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/194149.html原文链接:https://javaforall.cn

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022年9月13日 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 什么是ForkJoin、ForkJoin分支合并、ForkJoin工作窃取、ForkJoin大数据求和计算
  • 什么是ForkJoin?
  • ForkJoin:分支合并
  • ForkJoin特点:工作窃取
  • 如何让使用ForkJoin
  • ForkJoin求和计算Demo
相关产品与服务
对象存储
对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档