首页
学习
活动
专区
工具
TVP
发布

扎心了老铁

专栏作者
89
文章
205702
阅读量
41
订阅数
Hadoop通过HCatalog编写Mapreduce任务访问hive库中schema数据
1、dirver package com.kangaroo.hadoop.drive; import java.util.Map; import java.util.Properties; import com.kangaroo.hadoop.mapper.AggregateMapper; import com.kangaroo.hadoop.reducer.AggregateReducer; import org.apache.hadoop.conf.Configured; import org.ap
用户1225216
2018-03-05
1.4K1
使用HDFS客户端java api读取hadoop集群上的信息
本文介绍使用hdfs java api的配置方法。 1、先解决依赖,pom <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-client</artifactId> <version>2.7.2</version> <scope>provided</scope> </dependency> 2、配置文件,存放h
用户1225216
2018-03-05
5.3K2
hadoop streaming编程小demo(python版)
大数据团队搞数据质量评测。自动化质检和监控平台是用django,MR也是通过python实现的。(后来发现有orc压缩问题,python不知道怎么解决,正在改成java版本) 这里展示一个python编写MR的例子吧。 抄一句话:Hadoop Streaming是Hadoop提供的一个编程工具,它允许用户使用任何可执行文件或者脚本文件作为Mapper和Reducer。 1、首先,先介绍一下背景,我们的数据是存放在hive里的。hive建表语句如下: 我们将会解析元数据,和HDFS上的数据进行merge,方便
用户1225216
2018-03-05
1K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档