首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Hadoop2伪分布模式安装

参照Apache的官方文档,Hadoop2还是蛮好搭建的,但是搭建好后,MapReduce的JobHistory页面却没法进去,这是因为JobHistory没有配置正确或者服务没有启动起来。...$cp id_rsa.pub authorized_keys $ssh localhost #此时不需要输入密码,证明配置成功 安装与配置 安装 我的安装路径为/usr/local/hadoop-2/hadoop2...,数据的存放路径为/usr/local/hadoop-2 下面的过程是将hadoop安装包存放在/usr/local/hadoop-2/hadoop2 $cd /usr/local $sudo mkdir...配置 可以参考我的配置文件进行配置https://github.com/yanghaogn/Hadoop/tree/master/Hadoop2/ConfPseudoDistributedMode,将该.../bin:/usr/local/hadoop-2/hadoop2/sbin 运行 $hadoop namenode -format #首次启动的时候需要 $sbin/start-all.sh #

14810

Hadoop学习笔记系列文章导航

HDFS是GFS的山寨版,Map-Reduce的思想来源于Goolge对Page rank的计算方法,HBase模仿的是Big Table,Zookeeper则学习了Chubby。...阶段中的Shuffle过程   (11)MapReduce中的排序和分组   (12)MapReduce中的常见算法 2.4 ZooKeeper部分:   (14)ZooKeeper环境搭建 2.5 HBase...部分:   (15)HBase框架学习之基础知识篇   (15)HBase框架学习之基础实践篇 2.6 Pig部分:   (16)Pig框架学习 2.7 Hive部分:   (17)Hive框架学习 2.8...  (19)Flume框架学习 2.10 项目实战部分:   (20)网站日志分析项目(一)项目介绍   (20)网站日志分析项目(二)数据清洗   (20)网站日志分析项目(三)统计分析 2.11 Hadoop2...部分:   (21)Hadoop2的改进内容简介   (22)Hadoop2.x环境搭建与配置 作者:周旭龙 出处:http://www.cnblogs.com/edisonchou/ 本文版权归作者和博客园共有

44020

hadoop(1):hadoop概述

MapReduce 也就是核心想法(先Map,再reduce) java8 里面也看见对应的方法,感觉如果数据量小,现在用别的也可以实现,只是时间会长很多 yarn 分布式资源调度 当然,hadoop1 和 hadoop2...hadoop生态图 Zookeeper 分布式协作服务 HBase 一个实时的nosql sql(关系型数据库) 和 nosql(非关系型数据库) mysql, Oracle、SQLServer、...DB2 都是关系型数据库(当数据量不是太大的时候,有又是) MongoDB(很常见的nosql), Redis(很常见的内存数据库),Vertica(很少人用,原来公司用过,很强大),HBase Hive..., HBase -> Hive 等) 没了解过 ---- Hadoop核心 Hadoop Common 很多项目都有common模块 常用的基础,都放在里面 Hadoop HDFS hadoop的 dfs...Metadata存储一些信息 比如, name名字, replicas备份数,路径等等 记得,android的apk也有META-INF, html一般头部也有 meta 信息 分开块处理信息 hadoop2

94530

HBaseHBase之what

来加速Hbase的访问,比如cache的.META.元数据的信息。...流程 老的Region寻址方式 在Hbase 0.96版本以前,Hbase有两个特殊的表,分别是-ROOT-表和.META.表,其中-ROOT-的位置存储在ZooKeeper中,-ROOT-本身存储了...(3)Hlog数量上限 前面说到Hlog为了保证Hbase数据的一致性,那么如果Hlog太多的话,会导致故障恢复的时间太长,因此Hbase会对Hlog的最大个数做限制。...该参数为:hbase.hregion.majorcompaction.jitter 具体算法为: hbase.hregion.majorcompaction参数的值乘于一个随机分数,这个随机分数不能超过...通过hbase.hregion.majorcompaction参数的值加上或减去hbase.hregion.majorcompaction参数的值乘于一个随机分数的值就确定下一次大合并的时间区间。

3.3K40

HBaseHBase之how

HBase Shell 常用命令: 注意:HBase在linux命令行下操作时,区分大小写 HBase API HBase 提供Java方式的原生接口,其中需要注意的有: (1)创建Connection...HBase Rest Gateway HBase附带的REST服务器,该服务器将HBase表,行,单元和元数据作为URL指定的资源公开。...HBase到Hive 将HBase的数据作为数据源,建立Hive外部表关联到HBase,利用Hive的HQL查询HBase数据,更进一步,将Hive的元数据同步到Impala,利用Impala的SQL...这是HBase二级索引出现的背景。即二级索引是为了让HBase能够提供更多维度的查询能力。...注意:HBase原生并不支持二级索引方案,但基于HBase的KeyValue数据模型与API,可以轻易地构建出二级索引数据。

3.2K20

Hbase(四):Hbase原理

Hbase(四):Hbase原理 Hbase的工作方式 region的分裂和结构 hbase表中的数据按照行键的字典顺序排序 hbase表中的数据按照行的的方向切分为多个region 最开始只有一个...写入数据到hdfs的过程其实是不断追加hfile的过程 Hbase写入数据 数据写入hbase时 先在hlog中记录日志 再修改memstore 直接返回成功 这样 不需要真正等待写入hdfs的过程 所以很快...由于hbase中的数据天然排序 再加上索引 整个查询也可以非常的快 Hbase中的region的寻址 在hbase中有一个hbase:meta表,其中存放了 表和region和regionSever 之间的对应关系信息...​ 支持增、删、读、改、顺序扫描操作 ​ 牺牲了一部分读的性能换取了高效写入能力 Hbase系统架构 hbase中的老大叫hmaster 小弟叫hregionServer 客户端叫Client...Zookeepr为hbase提供集群协调 client 访问hbase 保留一些缓存信息提升效率 zookeeper 保证任何时候集群只有一个HMaster 监控regionServer的状态

3.9K10
领券