首页
学习
活动
专区
工具
TVP
发布

about云

专栏成员
216
文章
329286
阅读量
58
订阅数
hadoop入门:第十章hadoop工具
问题导读 1.hadoop有哪些工具? 2.hadoop流的作用是什么? 3.hadoop集群负载如何模拟? 4.hadoop数据提取和分析工具是哪个? 1.Hadoop 流 文档简介
用户1410343
2018-03-27
1K0
企业该如何构建大数据平台【技术角度】
问题导读 1.作为一个技术人员,你认为该如何搭建大数据平台? 2.构建大数据平台,你认为包括哪些步骤? 3.本文是如何构建大数据平台的? 亲身参与,作为主力完成了一个信息大数据分析平台。中间经历了很多问题,算是有些经验,因而作答。 整体而言,大数据平台从平台部署和数据分析过程可分为如下几步: 1、linux系统安装 一般使用开源版的Redhat系统–CentOS作为底层平台。为了提供稳定的硬件基础,在给硬盘做RAID和挂载数据存储节点的时,需要按情况配置。例如,可以选择给HDFS的namenode
用户1410343
2018-03-27
2.3K0
Hadoop集群搭建总结及Hadoop2.5集群伪分布、完全分布搭建总结
问题导读 1.你认为Hadoop集群的搭建有什么共同点? 2.低版本升级高版本,你是如何操作的? Hadoop集群的搭建除了Hadoop1与Hadoop2的集群搭建有所区别之外,Hadoop2集群的搭建大部分都是相似的。 1.需要安装ssh,达到无密码互通 无密码互通,很多这里都遇到了问题,这里提供两篇帖子。 linux(ubuntu)无密码互通、相互登录高可靠文档 CentOS6.4之图解SSH无验证双向登陆配置 2.修改hostname hostname有临时修改于永久修改,详细见
用户1410343
2018-03-27
1.3K0
kafka权威指南 第二章第6节 Kafka集群配置与调优
问题导读: 1 Kafka集群有什么优势? 2 集群中部署多少个节点合适? 3 集群针对系统如何调优? Kafka集群 对于本地的开发工作或者概念性的验证工作,单个Kafka服务器就可以支撑
用户1410343
2018-03-26
1.4K0
日志分析实战之清洗日志小实例3:如何在spark shell中导入自定义包
问题导读 1.自定义包,本文放到哪个路径下面? 2.复制包之后,需要做哪些权限操作? 3.如何验证导入是否成功? 在复制到Linux中,首先需要修改的就是权限。 我们看到用户和组的权
用户1410343
2018-03-26
7930
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档