首页
学习
活动
专区
工具
TVP
发布

大数据成神之路

专注大数据领域的一切技术~
专栏作者
635
文章
1279196
阅读量
315
订阅数
我出题,你来算。根据Flink TaskManager内存模型,各部分内存分配?
Hi,我是王知无,一个大数据领域的原创作者。 先上一张官方给出的Flink(1.10版本以后)内存模型图示:
王知无-import_bigdata
2022-03-11
5830
【Spark重点难点】你的代码跑起来谁说了算?(内存管理)
这节课我们要讲的是Spark中的 【内存模型】,也就是决定我们Spark代码运行所需要的资源信息。
王知无-import_bigdata
2021-12-08
6260
Flink重点难点:内存模型与内存结构
Java 虚拟机在执行Java程序的过程中会把它在主存中管理的内存部分划分成多个区域,每个区域存放不同类型的数据。下图所示为java虚拟机运行的时候,主要的内存分区:
王知无-import_bigdata
2021-09-22
1.2K0
真·屠龙之术 | 一次SparkSQL性能分析与优化之旅及相关工具小结
本文是一个OLAP数据源接入到SparkSQL并进行优化的过程。本文总结了调优过程当中一些可以借鉴与讨论的地方,鉴于本人水平有限,还请有这方面调优经验的同学不吝赐教。
王知无-import_bigdata
2021-01-06
1.1K0
Hive性能调优 | 并行执行/严格模式/JVM重用/推测执行
通过设置属性hive.mapred.mode值为默认是非严格模式nonstrict 。开启严格模式需要修改hive.mapred.mode值为strict,开启严格模式可以禁止3种类型的查询。
王知无-import_bigdata
2020-11-06
7180
实战案例分享:根据 JVM crash 日志定位和分析问题
下面是一份crash report, 下面是截取了crash report的部分,用于分析:
王知无-import_bigdata
2020-11-06
2.2K0
Apache Doris在作业帮实时数仓中的应用实践
在Java里经常会判断一个对象是否为空,如果为空的对象访问方法,字段会抛出空指针异常,而空指针异常为运行异常,如果不抓取这个异常,有的时候会导致程序异常,为了解决这个问题,我们通常会在代码里显式的去判断该对象是否为空,进行为空的逻辑处理,这种做法逻辑虽然明确,但是由于空的逻辑并不是经常碰到,这样会导致有多余的逻辑分支判断。
王知无-import_bigdata
2020-11-06
1.2K0
JVM架构体系与GC命令小总结
Java虚拟机Java virtual machine(JVM) 是物理机器的软件实现。java编译器javac将源码文件.java编译成字节码文件.class,然后这个字节码文件.class被放到JVM中,装载并执行字节码文件.class。JVM架构图如下。
王知无-import_bigdata
2020-06-11
5120
Flink 1.10之改进的TaskManager内存模型与配置
Flink社区在FLIP-49提出了新版统一的TaskManager内存模型及配置,这也是Flink 1.10版本最主要的改进与优化点之一。根据社区的说法,该proposal致力于解决1.9版本及之前的TM内存配置的三个缺点:
王知无-import_bigdata
2020-05-20
3K1
HBase优化笔记
一般安装好的HBase集群,默认配置是给Master和RegionServer 1G的内存,而Memstore默认占0.4,也就是400MB。显然RegionServer给的1G真的太少了。
王知无-import_bigdata
2020-04-02
1.1K0
Hbase FAQ热门问答小集合
问:Hbase大量写入很慢,一个列族,每个200多列,一秒写30000条数据,使用mutate添加数据,clientbuffer缓存大小为10M,四台测试机,128G内存,分配60G给Hbase,该怎么优化?
王知无-import_bigdata
2020-03-18
4440
Flink原理 | Flink中的数据抽象及数据交换过程
场景描述:Flink作为一个高效的流框架,为了避免JVM的固有缺陷(java对象存储密度低,FGC影响吞吐和响应等),必然走上自主管理内存的道路。
王知无-import_bigdata
2019-12-05
2K1
Apache Flink的内存管理
JVM: JAVA本身提供了垃圾回收机制来实现内存管理 现今的GC(如Java和.NET)使用分代收集(generation collection),依照对象存活时间的长短使用不同的垃圾收集算法,以达到最好的收集性能。 以Java为例,整个Java堆可以切割成为三个部分: Young: Eden:存放新生对象。 Survivor:存放经过垃圾回收没有被清除的对象。 semi-Spaces:和Survivor做Copying collection。 Tenured:对象多次回收没有被清除,则移到该区块。 Pe
王知无-import_bigdata
2019-11-19
1.1K0
助力秋招-独孤九剑荡剑式 | Java语言&基础面试题
https://blog.csdn.net/sufu1065/article/details/88051083
王知无-import_bigdata
2019-09-16
6310
聊聊page cache与Kafka之间的事儿
关于Kafka的一个灵魂拷问:它为什么这么快? 或者说,为什么它能做到如此大的吞吐量和如此低的延迟?
王知无-import_bigdata
2019-08-16
4.9K0
Spark内存调优
Spark 作为一个基于内存的分布式计算引擎,其内存管理模块在整个系统中扮演着非常重要的角色。理解 Spark 内存管理的基本原理,有助于更好地开发 Spark 应用程序和进行性能调优。本文旨在梳理出 Spark 内存管理的脉络,抛砖引玉,引出读者对这个话题的深入探讨。本文中阐述的原理基于 Spark 2.1 版本,阅读本文需要读者有一定的 Spark 和 Java 基础,了解 RDD、Shuffle、JVM 等相关概念。
王知无-import_bigdata
2019-06-03
1.2K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档