最新最全的大数据技术体系

97 篇文章
6.7K 次阅读
13 人订阅

全部文章

ChinaManor

大数据系列思考题----[持续更新]

个人理解: hdfs启动流程 hdfs是Hadoop Distribute File System 的简称,即分布式文件系统,用于存储海量数据. hdfs...

8630
ChinaManor

知行教育项目介绍

开发环境: jdk:Jdk1.8 Scala:2.11.8 CDH6.2.1: zookeeper-3.4.5-cdh6.2.1、hadoop-3.0.0...

13030
ChinaManor

JDK.TomCat.Mysql安装部署

7730
ChinaManor

Java面试题_String 相加

答: 第一条语句打印的结果为false,(1分) 第二条语句打印的结果为true,(1分) (1分)javac编译可以对字符串常量直接相加的表达式进行优化,...

4820
ChinaManor

疯狂Java讲义_五子棋代码

6010
ChinaManor

04.Scala:高阶函数、隐式转换

scala 混合了面向对象和函数式的特性,在函数式编程语言中,函数是“头等公民”,它和Int、String、Class等其他类型处于同等的地位,可以像其他类型的...

7820
ChinaManor

03.Scala:样例类、模式匹配、Option、偏函数、泛型

样例类是一种特殊类,它可以用来快速定义一个用于保存数据的类(类似于Java POJO类),在后续要学习并发编程和spark、flink这些框架也都会经常使用它。

5120
ChinaManor

02.Scala:面向对象、Object、抽象类、内部类、特质Trait

scala是支持面向对象的,也有类和对象的概念。我们依然可以基于scala语言来开发面向对象的应用程序。

5410
ChinaManor

01.Scala:开发环境搭建、变量、判断、循环、函数、集合

早期,scala刚出现的时候,并没有怎么引起重视,随着Kafka和Spark这样基于scala的大数据框架的兴起,scala逐步进入大数据开发者的眼帘。scal...

8320
ChinaManor

2021-04-06

未被 external 修饰的是内部表(managed table),被 external 修饰的为外部表 (external table)

7810
ChinaManor

大数据面试题百日更新_Hadoop专题_Yarn专题(Day11)

YARN 的基本设计思想是将 MapReduce V1 中的 JobTracker 拆分为两个独立的服务:ResourceManager 和 Applicati...

7720
ChinaManor

Kafka可视化工具_Kafka-Eagle

3.2.2 安装Kafka-Eagle 1.安装JDK,并配置好JAVA_HOME。 2.将kafka_eagle上传,并解压到 /export/serve...

6640
ChinaManor

大数据面试题百日更新_Hadoop专题(Day10)

6820
ChinaManor

大数据面试题百日更新_Hadoop专题(Day09)

Map的输出到内存 Map将数据传入环形缓冲区,默认100MB 可修改,环形缓冲区中的数据到达一定的阈值时,默认0.8 可修改,进行溢写生成好多临时文件,多个...

6030
ChinaManor

分布式实时消息队列Kafka(一)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-RaU9EfHR-1617011887969)(20210329_分布式实时消息...

6530
ChinaManor

Scala第五章节

实际开发中, 我们需要编写大量的逻辑代码, 这就势必会涉及到重复的需求. 例如: 求10和20的最大值, 求11和22的最大值, 像这样的需求, 用来进行比较的...

9220
ChinaManor

Scala第四章节

在实际开发中, 我们要编写成千上万行代码, 代码的顺序不同, 执行结果肯定也会受到一些影响, 并且有些代码是满足特定条件才能执行的, 有些代码是要重复执行的. ...

8620
ChinaManor

Scala第二章节

Scala语句中, 单行代码最后的分号可写可不写. 如果是多行代码写在一行, 则中间的分号不能省略, 最后一条代码的分号可省略不写.

7420
ChinaManor

Scala第一章节

​ Scala(斯嘎拉)这个名字来源于"Scalable Language(可伸缩的语言)", 它是一门基于JVM的多范式编程语言, 通俗的说: Scala是一...

7110
ChinaManor

Kafka第二天笔记

分区分配策略:保障每个消费者尽量能够均衡地消费分区的数据,不能出现某个消费者消费分区的数量特别多,某个消费者消费的分区特别少

7220

扫码关注云+社区

领取腾讯云代金券