Pentaho Work with Big Data（四）—— 转换Hive里的数据

用户1148526

发布于 2022-05-07 13:04:55

2630

发布于 2022-05-07 13:04:55

文章被收录于专栏：Hadoop数据仓库

1. 建立hive表，导入原始数据，过程参考 http://blog.csdn.net/wzy0623/article/details/51133760 2. 建立一个作业，查询hive表，并将聚合数据写入一个hive表 （1）打开PDI，新建一个作业，如图1所示。

图1 （2）建立一个hive的数据库连接，如图2所示。

图2 说明： kettle连接hive的相关配置参考 http://blog.csdn.net/wzy0623/article/details/50903133。（3）共享数据库连接（可选）（4）编辑'SQL'作业项，如图3所示。

图3 （5）保存并执行作业，日志如图4所示。

图4 从图4可以看到，作业已经成功执行。（6）检查hive表，结果如图5所示。

图5 从图5可以看到，新建了weblogs_agg表，并装载了聚合数据。

本文参与腾讯云自媒体同步曝光计划，分享自作者个人站点/博客。

原始发表：2016-04-13，如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自作者个人站点/博客前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

登录后参与评论

0 条评论

热度