首页
学习
活动
专区
工具
TVP
发布

大数据成神之路

专注大数据领域的一切技术~
专栏作者
635
文章
1280229
阅读量
316
订阅数
impala + kudu | 大数据实时计算踩坑优化指南
一开始需要全量导入kudu,这时候我们先用sqoop把关系数据库数据导入临时表,再用impala从临时表导入kudu目标表 由于sqoop从关系型数据直接以parquet格式导入hive会有问题,这里默认hive的表都是text格式;每次导完到临时表,需要做invalidate metadata 表操作,不然后面直接导入kudu的时候会查不到数据. 除了查询,建议所有impala操作都在impala-shell而不在hue上面执行 impala并发写入kudu的时候,数据量比较大的时候 这时候kudu配
王知无-import_bigdata
2021-04-21
1.9K0
Spark on Hive & Hive on Spark,傻傻分不清楚
Spark通过Spark-SQL使用hive 语句,操作hive,底层运行的还是 spark rdd。
王知无-import_bigdata
2020-05-07
10.9K0
Flink整合Oozie Shell Action提交任务带Kerberos认证
原文:https://www.cnblogs.com/ljygz/p/11727770.html
王知无-import_bigdata
2020-02-19
1.2K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档