腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
浪淘沙
专栏作者
举报
86
文章
79072
阅读量
18
订阅数
订阅专栏
申请加入专栏
全部文章
其他
java
sql
spark
数据库
xml
apache
http
存储
mapreduce
开源
分布式
hadoop
hive
python
servlet
云数据库 SQL Server
云数据库 Redis
api
jdk
jvm
hbase
access
git
jar
tomcat
spring
编程算法
jdbc
安全
费用中心
php
go
.net
scala
node.js
mvc
ide
eclipse
github
maven
unix
访问管理
腾讯优客
xslt & xpath
容器
serverless
游戏
缓存
网络安全
ssh
mybatis
sql server
面向对象编程
zookeeper
aop
tcp/ip
数据分析
数据处理
windows
kafka
搜索文章
搜索
搜索
关闭
HDFS基本操作
hadoop
ssh
jdk
java
xml
一、hadoop搭建 1、修改主机名 2、ip等 3、主机映射 4、关闭防火墙(两种) 5、ssh免密登录(免密脚本) 6、安装jdk 配置环境变量 7、安装hadoop 配置文件的修改 hadoop-env.sh JAVA_HOME core-site.xml 客户端参数 namenode在哪里 hdfs-site.xml namenode和datanode存放的目录 mapred-site.xml 经过重命名之后才得到的文件,提交任务到哪里 yarn-site.xml 配置resourcemanager在哪里,资源的多少 HADOOP环境变量 8、安装程序分发集群 hosts文件 jdk安装文件 /etc.profile hadoop安装文件 9、namenode进行格式化 hadoop namenode -format 10、启动测试 start-dfs.sh hadoop-deams.sh 单独启动单台机器的进程 start-yarn 是在resourcemaneger启动的 二、shell命令操作hdfs
曼路
2018-10-18
763
0
SparkStreaming编程实现
spark
hadoop
hbase
hive
scala
3.MyNetworkTotalWordCountV2.scala(开发自己的实时词频统计程序(累计单词出现次数))
曼路
2018-10-18
692
0
Hive学习
hive
hadoop
数据库
sql
云数据库 SQL Server
Hive是基于Hadoop的一个数据仓库工具(离线),可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。
曼路
2018-10-18
1.1K
0
MapReduce操作实例
mapreduce
java
apache
hadoop
存储
要点:有一个combiner方法,可以在执行完map时调用,从而对数据进行先一步的处理,降低Reduce的IO压力。
曼路
2018-10-18
1.5K
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档