首页
学习
活动
专区
工具
TVP
发布

大数据技术栈

专栏成员
67
文章
88621
阅读量
17
订阅数
大数据OLAP框架对比
以上是在大数据处理方面常用的四种技术原理, 上面这些处理数据的方式极大程度的提高了单位时间内数据处理的能力, 但是其还是没有摆脱数据量和查询时间的线性关系。 于是在OLAP处理方式上, 我们多了一种:
solve
2020-03-20
3.9K0
Hive 多分组函数GROUPING SETS,GROUPING__ID,CUBE,ROLLUP
GROUPING SETS, GROUPING__ID, CUBE, ROLLUP 这几个分析函数通常用于OLAP中, 不能累加,而且需要根据不同维度上钻和下钻的指标统计, 比如,分小时、天、月的UV数。
solve
2019-11-10
1.8K0
Hive 修复分区 MSCK REPAIR TABLE
MSCK REPAIR TABLE命令主要是用来: 解决通过hdfs dfs -put或者hdfs api写入hive分区表的数据在hive中无法被查询到的问题。
solve
2019-11-10
7.1K0
Hive知识归纳——详解 hive 各个知识点
CREATE FUNCTION [db_name.] function_name AS class_name [USING JAR|FILE|ARCHIVE 'file_uri' [, JAR|FILE|ARCHIVE 'file_uri'] ];
solve
2019-10-30
1.7K0
Spark性能优化指南——高级篇
原文:https://tech.meituan.com/spark-tuning-pro.html
solve
2019-10-30
7580
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档