首页
学习
活动
专区
工具
TVP
发布

大数据学习笔记

专栏作者
533
文章
741763
阅读量
73
订阅数
Apache Kylin 2.3 构建Cube失败
1、问题 📷 需要查看错误日志 [root@node1 ~]# cd /opt/kylin-2.3.1/logs/ [root@node1 logs]# ll total 1664 -rw-r--r-- 1 root root 16674 May 30 08:18 kylin.gc.20356.0.current -rw-r--r-- 1 root root 6801 May 29 09:22 kylin.gc.31042.0.current -rw-r--r-- 1 root root 1
程裕强
2022-05-06
6910
杀死killHadoop Mapreduce job程序
(1)首先查找到僵死的JobID值 📷 (2)hadoop job -kill $Job_ID [root@bigdata01-test sqoop-1.4.7]# hadoop job -kill job_1526097883376_0059 DEPRECATED: Use of this script to execute mapred command is deprecated. Instead use the mapred command for it. 18/05/25 14:35:13
程裕强
2022-05-06
2080
命令修改副本数:hadoop fs -setrep
1、hadoop fs -setrep setrep Usage: hadoop fs -setrep [-R] [-w] <numReplicas> <path> Changes the replication factor of a file. If path is a directory then the command recursively changes the replication factor of all files under the directory tree rooted a
程裕强
2022-05-06
2710
基于Docker的Hadoop集群快速搭建
/24的意思是,子网掩码255.255.255.0 @后面的ip为Docker容器宿主机的网关
程裕强
2022-05-06
6810
Hadoop基础教程-第9章 HA高可用(9.2 HDFS 高可用配置)
因为前面我们已经配置启动了普通的Hadoop相关服务,需要先停止相关服务并清除数据。 (1)停止Hadoop服务 首先停止YARN
程裕强
2022-05-06
2540
Hadoop基础教程-第9章 HA高可用(9.1 HDFS 高可用介绍)
HDFS HA(High Availability)高可用配置官方参考网址 http://hadoop.apache.org/docs/r2.7.3/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabilityWithQJM.html
程裕强
2022-05-06
7980
Hadoop基础教程-第7章 MapReduce进阶(7.3 MapReduce API)
原文地址:http://blog.csdn.net/chengyuqiang/article/details/73410106
程裕强
2022-05-06
1910
Hadoop基础教程-第6章 MapReduce入门(6.5 温度统计)
《HADOOP权威指南 第3版 》教程中有个经典例子,既是温度统计。作者Tom White在书中写了程序和讲解了原理,认为读者们都会MapReduce程序的基本环境搭建部署,所以这里轻描淡写给带过了,对于初学者来说,这是一个“天坑”,程序跑步起来,也就消磨了Hadoop初学者的兴趣和意志。
程裕强
2022-05-06
4940
Hadoop基础教程-第6章 MapReduce入门(6.4 MapReduce程序框架)
我们知道,从单线程编程到多线程编程,程序结构复杂度增大了。类似的,从单机程序到分布式程序,程序结构的复杂度也增大了。这是问题的复杂环境决定的。 所以,很多初学者更接触分布式编程时,望而却步、知难而退了。可事实上,Hadoop是一个很易用的分布式编程框架,经过良好封装屏蔽了很多分布式环境下的复杂问题,因此,对普通开发者来说很容易,容易到可以依照程序模版,照葫芦画瓢。 下面代码即是Hadoop的MapReduce程序模版,其中使用了Hadoop辅助类,通过Configured的getConf()方法获取Configuration对象,重写Tool接口的run方法,实现Job提交功能。 这样就可以实现代码与配置隔离,修改MapReduce参数不需要修改java代码、打包、部署,提高工作效率。
程裕强
2022-05-06
2380
Hadoop基础教程-第6章 MapReduce入门(6.2 解读WordCount)
WordCount程序就是MapReduce的HelloWord程序。通过对WordCount程序分析,我们可以了解MapReduce程序的基本结构和执行过程。
程裕强
2022-05-06
4090
Hadoop基础教程-第5章 YARN:资源调度平台(5.5 YARN的调度器)
打个比方,Hadoop相当于一台虚拟计算机(由多台计算机构造的集群),那么HDFS就是这台虚拟计算机的文件系统,管理磁盘资源;而YARN负责管理虚拟计算机的CPU和内存资源。在YARN上跑的MapReduce程序(比如5.4节跑的PI和wordcount两个应用程序)就是在这台虚拟计算机跑的应用程序,需要磁盘、内存和CPU等资源。
程裕强
2022-05-06
3470
Hadoop基础教程-第5章 YARN:资源调度平台(5.2 YARN参数解读与调优)
yarn-site.xml文件默认参数: http://hadoop.apache.org/docs/r2.7.3/hadoop-yarn/hadoop-yarn-common/yarn-default.xml
程裕强
2022-05-06
3060
Hadoop基础教程-第5章 YARN:资源调度平台(5.1 YARN介绍)
YARN的全称是Yet Another Resource Negotiator,意为另一种资源调度者。 从Apache Hadoop 2.0开始, Hadoop包含 YARN。
程裕强
2022-05-06
3200
Hadoop基础教程-第4章 HDFS的Java API(4.3 pom.xml解析)
在pom.xml文件里添加hadoop的依赖包hadoop-common, hadoop-client, hadoop-hdfs 在搜索框中输入hadoop-common,单击“Search”按钮
程裕强
2022-05-06
4880
Hadoop基础教程-第3章 HDFS:分布式文件系统(3.5 HDFS基本命令)(草稿)
HDFS命令官方文档: http://hadoop.apache.org/docs/r2.7.3/hadoop-project-dist/hadoop-hdfs/HDFSCommands.html
程裕强
2022-05-06
1990
Hadoop基础教程-第3章 HDFS:分布式文件系统(3.4 HDFS集群模式)
【2018-01-27补充】 感谢吴家行hang的提醒,这里node2和node3也要进行类似的环境变量配置。
程裕强
2022-05-06
2160
Hadoop基础教程-第3章 HDFS:分布式文件系统(3.3 HDFS参数解读)
Hadoop官方文档地址: http://hadoop.apache.org/docs/r2.7.3/
程裕强
2022-05-06
1720
Hadoop基础教程-第2章 Hadoop快速入门(2.5 WordContent简单应用)
hdfs命令位于bin目录下,通过hdfs dfs -mkdir命令可以创建一个目录。
程裕强
2022-05-06
2810
Hadoop基础教程-第2章 Hadoop快速入门(2.4 Hadoop单机运行)
或者cd /opt/hadoop-2.7.3进入Hadoop根目录 通过pwd命令可以知道当前所在目录
程裕强
2022-05-06
2570
Hadoop基础教程-第2章 Hadoop快速入门(2.3 Hadoop单机配置)
常见的Hadoop部署模式分为单机模式和集群模式,也称为伪分布式模式和分布式模式。 单机模式(伪分布式)模式是在一个节点上部署所有的Hadoop服务。在使用上,单机模式(伪分布式)模式跟集群模式(分布式模式)是一样的。
程裕强
2022-05-06
2790
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档