腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

大数据成神之路

专注大数据领域的一切技术~

专栏作者

635

文章

1280229

阅读量

316

订阅数

impala + kudu | 大数据实时计算踩坑优化指南

hive shell node.js 大数据 sql

一开始需要全量导入kudu，这时候我们先用sqoop把关系数据库数据导入临时表，再用impala从临时表导入kudu目标表由于sqoop从关系型数据直接以parquet格式导入hive会有问题，这里默认hive的表都是text格式；每次导完到临时表，需要做invalidate metadata 表操作，不然后面直接导入kudu的时候会查不到数据. 除了查询，建议所有impala操作都在impala-shell而不在hue上面执行 impala并发写入kudu的时候，数据量比较大的时候这时候kudu配

王知无-import_bigdata

2021-04-21

1.9K0

Spark on Hive & Hive on Spark，傻傻分不清楚

hive spark xml shell sql

Spark通过Spark-SQL使用hive 语句,操作hive,底层运行的还是 spark rdd。

王知无-import_bigdata

2020-05-07

10.9K0

Flink整合Oozie Shell Action提交任务带Kerberos认证

shell kerberos 大数据 yarn node.js

原文：https://www.cnblogs.com/ljygz/p/11727770.html

王知无-import_bigdata

2020-02-19

1.2K0

没有更多了

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态