首页
学习
活动
专区
工具
TVP
发布

测试开发架构之路

专栏作者
241
文章
321850
阅读量
64
订阅数
【转载】Impala和Hive的区别
Impala是基于Hive的大数据实时分析查询引擎,直接使用Hive的元数据库Metadata,意味着impala元数据都存储在Hive的metastore中。并且impala兼容Hive的sql解析,实现了Hive的SQL语义的子集,功能还在不断的完善中。
互联网金融打杂
2018-08-02
7.1K0
通过sqoop将hdfs数据导入MySQL
简介:Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。
互联网金融打杂
2018-08-02
1.5K0
hadoop配置分区
1.运行MR,得出HDFS路径下数据 2.创建 Hive 表 映射 HDFS下的数据 3.为数据创建分区,在hive下执行 source 分区表; TIPS:结果集的时间,必须在分区范围内; 可以理解一下:hive sql 是在创建表以及结果的时候分区;           MR运行结果,必须额外分区;额外分区的话,就是mr,MR每天跑数据,自行插入到分区; 此外,Hive 对数据的定义类型 有很大关系,如果数据格式超出范围,则数据显示为null;例如: yield_rate   decimal(10, 1
互联网金融打杂
2018-07-05
4050
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档