首页
学习
活动
专区
工具
TVP
发布

YoungGy

专栏作者
145
文章
152654
阅读量
50
订阅数
Hadoop安装教程_单机及伪分布式
配置新的hadoop用户 查看是否配置成功 为hadoop用户增加管理员权限 退出重新登陆
用户1147754
2019-05-27
4640
Hadoop安装教程_分布式集群
选择典型的集群规划,即一台Master,两台Slave的设置。 主机名及局域网IP配置如下:
用户1147754
2019-05-26
4440
hadoop_入门1
该文介绍了如何使用 Hadoop 进行单词计数和排序。首先介绍了 Hadoop 的整体架构,然后详细讲解了如何使用 Hadoop 进行单词计数和排序。最后,通过一个实例展示了如何使用 Hadoop 进行排序操作。
用户1147754
2018-01-03
5780
HIVE入门_1
本文介绍了如何使用 Hive 进行数据倾斜处理。首先介绍了 Hive 数据倾斜的基本概念,然后通过示例介绍了如何通过分桶、合并小文件、增加 Reduce 数目、使用 CombineTable 等方式来解决数据倾斜问题。同时,本文还提供了避免数据倾斜的一些建议,例如通过合理设置 Map 和 Reduce 数目、使用 Merge-on-Read(MOR)表、合理设置缓存、使用 Table 和 Partition 等方法。通过这些方法,可以有效地解决 Hive 中的数据倾斜问题,提高数据处理效率。
用户1147754
2018-01-02
4870
HIVE入门_2
用户1147754
2018-01-02
1.5K0
没有更多了
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档