腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
文渊之博
专栏作者
举报
182
文章
305280
阅读量
38
订阅数
订阅专栏
申请加入专栏
全部文章
sql server
sql
数据库
其他
python
spark
编程算法
hive
大数据
云数据库 SQL Server
node.js
存储
java
linux
数据处理
hbase
打包
mapreduce
TDSQL MySQL 版
http
缓存
powershell
数据
go
bash
api
unix
bash 指令
shell
hadoop
jvm
数据分析
windows
数据结构
机器学习
javascript
scala
xml
html
jquery
云数据库 Redis
搜索引擎
es 2
数据备份
数据安全
kafka
Elasticsearch Service
clickhouse
null
函数
连接
排序
数据挖掘
perl
actionscript
r 语言
flask
ide
lucene/solr
apache
专用宿主机
云推荐引擎
mongodb
企业
yarn
rollup.js
容器
开源
分布式
html5
ftp
grep
tcp/ip
安全
数据可视化
nest
es
flink
数据脱敏
数据集成
app
default
definition
difference
hdfs
intersection
join
lag
list
offset
partition
presto
rank
set
sort
sum
union
部署
地图
集合
脚本
配置
事件
统计
优化
搜索文章
搜索
搜索
关闭
如何快速同步hdfs数据到ck
大数据
spark
kafka
数据处理
hive
ClickHouse是面向OLAP的分布式列式DBMS。我们部门目前已经把所有数据分析相关的日志数据存储至ClickHouse这个优秀的数据仓库之中,当前日数据量达到了300亿。
用户1217611
2022-05-06
927
0
shell 脚本执行带参数的hivesql
编程算法
hive
shell
原文连接:https://issues.apache.org/jira/browse/HIVE-2020
用户1217611
2022-05-06
3.9K
0
kylin简单优化cube
hive
sql
理论上,对于N维,你最终会得到2 ^ N维组合。但是对于某些维度组,不需要创建这么多组合。例如,如果您有三个维度:洲,国家,城市(在层次结构中,“更大”维度首先出现)。在深入分析时,您只需要以下三种组合组合:
用户1217611
2022-05-06
694
0
hivesql导出本地文件
sql
hive
做数据分析的时候,经常会用到hive -e "sql" > xxx.txt或者最原始的hive命令行来获得查询结果,然后再将查询结果放到Excel等工具中,但是如果查询的字段太多,这时候将查询结果放到Excel会经常会碰到错位问题,很是头疼.
用户1217611
2021-01-21
1.4K
0
hbase 面试问题汇总
hbase
TDSQL MySQL 版
hive
html
存储
(2)、无模式:每行都有一个可排序的主键和任意多的列,列可以根据需要动态增加,同一个表中的不同行的可以有截然不同的列。
用户1217611
2020-06-19
751
0
sparksql 概述
spark
api
hive
python
mapreduce
Spark SQL是Spark用来处理结构化数据的一个模块,它提供了2个编程抽象:DataFrame和DataSet,并且作为分布式SQL查询引擎的作用。
用户1217611
2020-06-19
1K
0
Hive简介
hive
数据库
sql
数据分析
hadoop
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。
用户1217611
2020-06-19
1.2K
0
hive基础总结(面试常用)
hive
数据库
sql
jvm
hadoop
hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 Metastore (hive元数据) Hive将元数据存储在数据库中,比如mysql ,derby.Hive中的元数据包括表的名称,表的列和分区及其属性,表的数据所在的目录 Hive数据存储在HDFS,大部分的查询、计算由mapreduce完成 Hive数据仓库于数据库的异同 (1)由于Hive采用了SQL的查询语言HQL,因此很容易将Hive理解为数据库。其实从结构上来看,Hive和数据库除了拥有类似的查询语言, 再无类似之处。 (2)数据存储位置。 hdfs raw local fs (3)数据格式。 分隔符 (4)数据更新。hive读多写少。Hive中不支持对数据的改写和添加,所有的数据都是在加载的时候中确定好的。 INSERT INTO … VALUES添加数据,使用UPDATE … SET修改数据 不支持的 HDFS 一次写入多次读取 (5) 执行。hive通过MapReduce来实现的 而数据库通常有自己的执行引擎。 (6)执行延迟。由于没有索引,需要扫描整个表,因此延迟较高。另外一个导致Hive执行延迟高的因素是MapReduce框架 (7)可扩展性 (8)数据规模。 hive几种基本表类型:内部表、外部表、分区表、桶表 内部表(管理表)和外部表的区别: 创建表 外部表创建表的时候,不会移动数到数据仓库目录中(/user/hive/warehouse),只会记录表数据存放的路径 内部表会把数据复制或剪切到表的目录下 删除表 外部表在删除表的时候只会删除表的元数据信息不会删除表数据 内部表删除时会将元数据信息和表数据同时删除 表类型一、管理表或内部表Table Type: MANAGED_TABLE
用户1217611
2019-05-25
709
0
Hive 时间日期处理总结
hive
最近用hive比较多,虽然效率低,但是由于都是T+1的业务模式。所以也就不要求太多了,够用就行。其中用的吧比较多就是时间了,由于大数据中很多字段都不是标准的时间类型字段,所以期间涉及了很多的时间日期字
用户1217611
2018-03-29
2.8K
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档