首页
学习
活动
专区
工具
TVP
发布

星汉技术

专栏作者
119
文章
195157
阅读量
45
订阅数
原 Spark On Yarn完全分布式搭
Spark On Yarn完全分布式搭建     Spark On Yarn的搭建分为三个阶段,第一个是Zookeeper集群的搭建,第二是Hadoop集群的搭建,第三是Spark集群的搭建。所以以下将按照这三个步骤来给大家进行展示Spark On Yarn完全分布式搭建。 一、准备 1、软件及版本     1. jdk-8u65-linux-x64.tar.gz     2. scala-2.11.0.tgz     3. zookeeper-3.4.7.tar.gz     4. hadoop-2.7.
云飞扬
2018-05-17
1.6K0
Kafka的存储机制以及可靠性
Kafka的存储机制以及可靠性 一、kafka的存储机制     kafka通过topic来分主题存放数据,主题内有分区,分区可以有多个副本,分区的内部还细分为若干个segment。     所谓的分区其实就是在kafka对应存储目录下创建的文件夹,文件夹的名字是主题名加上分区编号,编号从0开始。 1、segment     所谓的segment其实就是在分区对应的文件夹下产生的文件。     一个分区会被划分成大小相等的若干segment,这样一方面保证了分区的数据被划分到多个文件中保证不会产生体积过大的
云飞扬
2018-05-11
7430
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档