#Hive

Apache Hive是一个建立在Hadoop架构之上的数据仓库。它能够提供数据的精炼,查询和分析。

Java调用matlab

sofu456

mcc Compile MATLAB functions for deployment outside MATLAB. Options applicable ...

100

0886-7.1.7-Hive1与Hive3中Decimal数据计算结果精度缺失问题分析

Fayson

将集群从CDH升级到CDP后,Hive1与Hive3在Decimal精度的处理上发生了变化,导致两个版本的Hive在进行Decimal类型的数据计算时存在差异,...

500

大数据生态圈常用组件(二):概括介绍、功能特性、适用场景

不吃西红柿

点赞之后,上一篇传送门: https://blog.csdn.net/weixin_39032019/article/details/89340739

1620

记一次python清洗疫情历史数据

不愿意做鱼的小鲸鱼

数据的来源是用了GitHub上这个我收藏了很久的项目:https://lab.isaaclin.cn/nCoV/ 数据仓库链接:https://github....

1830

大作业——新冠肺炎疫情的数据采集和可视化分析系统

不愿意做鱼的小鲸鱼

这次大作业的主要流程是: 首先要采集数据,采用脚本定时采集的那种,采集的数据来源这篇博文:https://www.dzyong.com/#/ViewArtic...

820

一面数据: Hadoop 迁移云上架构设计与实践

从大数据到人工智能

要迁移的数据包括两部分:Hive Metastore 元数据以及 HDFS 上的文件。由于不能中断业务,采用存量同步 + 增量同步(双写)的方式进行迁移;数据同...

1620

数据仓库——hive的相关配置和操作

不愿意做鱼的小鲸鱼

点击下载 链接:https://pan.baidu.com/s/1Z4VG7mPBpmW6mWpR_WcyPQ 提取码:7afc

8750

Nexus:搭建私人Maven仓库

用户4480853

访问 Oracle 官网来获取 Java 8/11/17/latest 版本,Windows 平台可通过 x64 Compressed Archive 安装、L...

4920

开源项目丨一文详解一站式大数据平台运维管家 ChengYing 如何部署 Hadoop 集群

数栈DTinsight

选择计算组件模块,选择需要对接的计算引擎 Hive 和 Spark,选择 Hive 和 Spark 的版本,填写对应的 jdbc(jdbc:hive://ip:...

5010

Hive 高频考点讲解

sowhat1412

Hive 是 FaceBook 开源的一款基于 Hadoop 数据仓库工具,它可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。

6210

Presto实战

全栈程序员站长

Presto支持在线数据查询,包括Hive, Cassandra, 关系数据库以及专有数据存储。一条Presto查询可以将多个数据源的数据进行合并,可以跨越整个...

6420

自动生成测试用例_测试用例设计的完整过程

全栈程序员站长

写用例之前,我们应该熟悉API的详细信息。建议使用抓包工具Charles或AnyProxy进行抓包。

5320

python批量生成测试用例_系统测试用例的编写依据

全栈程序员站长

写用例之前,我们应该熟悉API的详细信息。建议使用抓包工具Charles或AnyProxy进行抓包。

5430

自动生成测试用例_接口测试用例自动生成工具

全栈程序员站长

写用例之前,我们应该熟悉API的详细信息。建议使用抓包工具Charles或AnyProxy进行抓包。

10440

【拿走不谢】大数据高效查询神器--bitmap

不吃西红柿

https://github.com/lihuigang/hive-bitmap-udf

6550

数据倾斜?几招把你安排的板板正正的!

不吃西红柿

一般都发生在Sql中group by和join on上,而且和数据逻辑绑定比较深。

5420

hive like与rlike的区别

全栈程序员站长

项目github地址:[bitcarmanlee easy-algorithm-interview-and-practice](https://github.c...

6910

如何对CDP中的Hive元数据表进行调优

从大数据到人工智能

在日常使用中,我们可以发现在hive元数据库中的TBL_COL_PRIVS,TBL_PRIVS 、PART_COL_STATS表相当大,部分特殊情况下NOTIF...

3710

【Hive】hive 数据倾斜、优化策略、hive执行过程、垃圾回收

从大数据到人工智能

Hadoop MapReduce 程序中,reducer 个数的设定极大影响执行效率,这使得 Hive 怎样决定reducer 个数成为一个关键问题。遗憾的是 ...

6720

Hive一次更新多个分区数据方案

awwewwbbb

订单数据之类的业务表,因为有状态要更新,比如订单状态,物流状态之类的,需要同步很久之前的数据到Hive. 如何同步时在Hive中进行操作一次更新多个分区内的数据...

5910

扫码关注腾讯云开发者

领取腾讯云代金券