首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#hadoop

Apache Hadoop是一款支持数据密集型分布式应用程序并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。

Hadoop HDFS介绍及入门基础

用户7353950

1. 高容错性:HDFS通过数据复制和故障检测机制确保数据的高可用性。每个文件被分割成多个块,并存储在多个DataNode(数据节点)上,通常有多个副本。即使部...

9210

大数据毕业设计的"万能公式"

叫我阿柒啊

最近,很多同学都在问大数据的毕业设计如何做,如何能把大数据的毕业设计做出点东西等等,今天就主要写写大数据毕业设计如何做,以及大数据毕业的设计的难点在哪。

18631

一篇讲明白 Hadoop 生态的三大部件

July

NNW · 高级DBA (已认证)

进入大数据阶段就意味着进入NoSQL阶段,更多的是面向OLAP场景,即数据仓库、BI应用等。

9410

深入解析Hadoop生态核心组件:HDFS、MapReduce和YARN

洁洁

进入大数据阶段就意味着进入NoSQL阶段,更多的是面向OLAP场景,即数据仓库、BI应用等。 大数据技术的发展并不是偶然的,它的背后是对于成本的考量。集中式数...

33630

Hadoop 集群部署

Freedom123

Hadoop各个功能模块的理解 零. 概述 HDFS模块 HDFS负责大数据的存储,通过将大文件分块后进行分布式存储方式,突破了服务器硬盘大...

8710

CM+CDH Hadoop 集群部署

Freedom123

2. 环境配置 2.1 基本配置(本配置在CM机器上操作,其他机器秩序操作 前三步) (1) 修改network (修改计算机标...

6510

Ambari+HDP 部署Hadoop 集群

Freedom123

1. 服务器准备     1 主机名         1.1 修改hostname            

10810

Hadoop怎么处理数据

为了伟大的房产事业

Hadoop是一个流行的分布式计算框架,它允许处理大规模数据集。在本文中,我们将探讨Hadoop任务提交的步骤以及对数据处理的基本过程。

8610

【大数据】Hadoop技术解析:大数据处理的核心引擎

为了伟大的房产事业

在当今的信息时代,大数据已经成为商业和科学研究的关键资源。然而,处理和分析大数据集是一个庞大而复杂的任务。在这个挑战性领域,Hadoop已经崭露头角,它是一...

17510

基于 HBase & Phoenix 构建实时数仓(1)—— Hadoop HA 安装部署

用户1148526

172.18.4.126 node1 172.18.4.188 node2 172.18.4.71 node3 172.18.4.8...

8710

以 Hadoop 和 PostgreSQL 为例,探析数据库拆解的影响

深度学习与Python

数据库界最近的一个趋势是将数据库拆解成它的组成部分。每个组件都是单独提供的,因此基础设施工程师可以将它们集成到数据库中。

11510

「EMR 开发指南」之 Sqoop 常见问题处理

岳涛

腾讯 · 大数据SRE研发工程师 (已认证)

Sqoop是一种用于在Apache Hadoop和结构化数据存储(如关系数据库)之间传输数据的开源工具。它允许用户在Hadoop分布式文件系统(HDFS)和外部...

24430

Hadoop 和大数据的关系是什么?和 Spark的关系是什么?

LakeShen

最近在知乎上面看到这样一个问题:Hadoop 和大数据的关系?和 Spark 的关系?

7510

virtual导入hadoop集群

h3110_w0r1d

9610

Hadoop完全分布式搭建

h3110_w0r1d

*通过共享文件夹的方式将j**d**k的安装包放在ma**ster**节点的/**root/downloads**文件夹下*

15910

Hadoop的HDFS操作

h3110_w0r1d

在本地创建目录 /home/marry ,并在该目录下创建三个空文件,文件名分别为1.txt,2.txt,3.txt

9610

Hadoop学习:深入解析MapReduce的大数据魔力之数据压缩(四)

老虎也淘气

压缩方式选择时重点考虑:压缩/解压缩速度、压缩率(压缩后存储大小)、压缩后是否 可以支持切片。

13610

Hadoop学习:深入解析MapReduce的大数据魔力(三)

老虎也淘气

(1)Read阶段:MapTask通过InputFormat获得的RecordReader,从输入InputSplit中解析出一个个key/value。

9510

Hadoop学习:深入解析MapReduce的大数据魔力(二)

老虎也淘气

1、问题引出 要求将统计结果按照条件输出到不同文件中(分区)。比如:将统计结果按照手机 归属地不同省份输出到不同文件中(分区) 2、默认Partition...

9310
领券