首页
学习
活动
专区
工具
TVP
发布

暴走大数据

专栏作者
298
文章
532964
阅读量
99
订阅数
保姆级超详细教程:DolphinScheduler单机(本地)部署及软件运行测试
下载最新版本的后端安装包至服务器部署目录,比如创建 /opt/dolphinscheduler 做为安装部署目录,下载地址:https://dlcdn.apache.org/dolphinscheduler/1.3.8/apache-dolphinscheduler-1.3.8-src.tar.gz,下载后上传 tar 包到该目录中
大数据真好玩
2021-12-02
4K0
从面试角度详解Kafka
Kafka 是一个优秀的分布式消息中间件,许多系统中都会使用到 Kafka 来做消息通信。对分布式消息系统的了解和使用几乎成为一个开发人员必备的技能。
大数据真好玩
2021-07-12
6370
Apache Doris 的一场编译之旅
直接访问官方文档,中文的官方文档对于阅读是比较友好的,正常情况下直接对照文档建议的来基本上不会存在大问题。编译部分官方推荐使用官方提供的 Docker 镜像(Dockerfile),这样省去了编译环节中出现的各种环境问题。使用直接编译方式需要注意第三方包的下载一定要下载指定连接的包且务必完整,推荐使用 Docker 镜像方式进行编译,这样不仅可以省去环境的配置,同时编译的时候还省去了不太好下载的几十个三方包的下载。
大数据真好玩
2021-04-21
4.6K0
Kafka学习笔记之概述、入门、架构深入
Kafka 是一个分布式的基于发布/订阅模式的消息队列(Message Queue),主要应用于大数据实时处理领域。
大数据真好玩
2021-03-15
4850
Flink源码解读系列 | Flink集群Standalone启动脚本
在最后调用了jobmanager.sh start 这个脚本和config.sh 中的TMSlaves 这个方法,分别启动了jobmanager和taskmanager
大数据真好玩
2020-09-07
6470
Spark Core源码精读计划24 | StaticMemoryManager——静态内存管理机制
在上一篇文章的最后,我们阅读了内存管理器MemoryManager抽象类的源码,并且提到它有两种实现:静态内存管理器StaticMemoryManager、统一内存管理器UnifiedMemoryManager。其中,StaticMemoryManager是随着Spark诞生就存在的,UnifiedMemoryManager则是从Spark 1.6版本开始服役,并且后者是目前Spark Core中的默认内存管理器,前者已经标记为过时。虽然StaticMemoryManager已经不怎么用了,但它的逻辑相对简单,适合用来开胃,本文先来研究它。看官也可以先复习一下上篇文章关于MemoryManager的部分。
大数据真好玩
2019-08-21
4270
Spark Shuffle演进
Shuffle就是将不同节点上相同的Key拉取到一个节点的过程。这之中涉及到各种IO,所以执行时间势必会较长。对shuffle的优化也是spark job优化的重点。
大数据真好玩
2019-08-08
6980
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档