腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Java工程师成长之路

专栏作者

210

文章

247749

阅读量

43

订阅数

hadoop中HDFS的NameNode原理

大数据云数据库 Redis hadoop 压力测试分布式

1. hadoop中HDFS的NameNode原理 1.1. 组成包括HDFS（分布式文件系统），YARN（分布式资源调度系统），MapReduce（分布式计算系统），等等。 1.2. HDFS架构原理比如现在要上传一个1T的大文件，提交给HDFS的Active NameNode（用以存放文件目录树，权限设置，副本数设置等），它会在指定目录下创建一个新的文件对象，比如access_20180101.log 至于具体数据，它会将它拆分后进行分布式存储，分散在各个DataNode节点，且默认都会有3个副本

2019-09-10

6320

大数据基础Hadoop 2.x入门

hadoop 大数据 node.js bash bash 指令

hadoop概述存储和分析网络数据三大组件 MapReduce 对海量数据的处理思想：分而治之每个数据集进行逻辑业务处理map 合并统计数据结果reduce HDFS 储存海量数据分布式存储安全性高副本数据 YARN 分布式资源管理框架管理整个集群的资源（内存、CPU核数）分配调度集群资源 Common 工具 hadoop生态圈 Hive（蜜蜂）通过使用sql语句来执行hadoop任务 HBase 存储结构化数据的分布式数据库 HBase放弃了事务特性，追求更高的扩展

2019-09-10

3070

Spark从入门到精通（一）

spark hive sql hadoop 存储

什么是Spark 大数据计算框架离线批处理大数据体系架构图（Spark） Spark包含了大数据领域常见的各种计算框架：比如Spark Core用于离线计算，Spark SQL用于交互式查询，

2019-09-10

3620

没有更多了

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态