首页
学习
活动
专区
工具
TVP
发布

大数据实战演练

专栏作者
156
文章
535489
阅读量
60
订阅数
Ambari安装hive服务,数据库Connection Failed
因为写 ambari 相关的文章比较多,所以有很多使用 ambari 的朋友加我好友,发现有很多初学者都会卡在一个地方,就是安装依赖 mysql 的服务会提示:MYSQL Connection: Error ,像安装 hive、oozie、ranger 等等服务都会遇到这个问题。
create17
2022-11-17
1.2K0
数仓面试高频考点--解决hive小文件过多问题
hive 中的小文件肯定是向 hive 表中导入数据时产生,所以先看下向 hive 中导入数据的几种方式
create17
2021-04-07
6210
Hive MetaStore 在快手遇到的挑战与优化
导读:快手基于Hive构建数据仓库,并把Hive的元数据信息存储在MySql中,随着业务发展和数据增长,一方面对于计算引擎提出了更高的要求,同时也给Hive元数据库的服务稳定性带来了巨大的挑战。本文将主要介绍Hive MetaStore服务在快手的挑战与优化,包括:
create17
2021-04-07
7760
基于Kerberos环境下,使用Java连接操作Hive
虽然可以使用 Hive 服务本身的 Principal 与 keytab 来连接 Hive ,但使用服务本身的 principal 不具有普遍性,所以还是建议使用自定义的 Principal 。
create17
2019-08-20
8.5K1
Sqoop1.4.7实现将Mysql数据与Hadoop3.0数据互相抽取
将 mysql 数据库中的 hive 数据库中的 ROLES 表数据导入到 HDFS 中的 /tmp/root/111 目录下。执行代码如下:
create17
2019-08-05
2.3K0
如何将Hive与HBase整合联用
之前学习 HBase 就有疑惑,HBase 虽然可以存储数亿或数十亿行数据,但是对于数据分析来说,不太友好,只提供了简单的基于 Key 值的快速查询能力,没法进行大量的条件查询。
create17
2019-05-28
3K0
Kylin集群模式部署(使用同一HBase存储)
本文主要讲解如何部署Kylin集群,采取多个Kylin实例共享HBase存储的模式,如果需要事先了解Kylin基本概念的朋友可以查看《Apache Kylin基本原理及概念》。
create17
2019-04-17
2.1K5
Apache Kylin目录详解
Kylin 会在 HDFS 上生成文件,根目录是 “/kylin” (可以在conf/kylin.properties中定制),然后会使用 Kylin 集群的元数据表名作为第二层目录名,默认为 “kylin_metadata”。
create17
2019-04-17
1.2K0
HDFS ACL权限设置
今天主要给大家说一下HDFS文件权限的问题。当一个普通用户去访问HDFS文件时,可能会报Permission denied的错误。那么你会怎么做呢?
create17
2019-03-19
9.3K0
如何在HUE上通过oozie调用Hive SQL工作流
执行Hive SQL脚本查询mytable表数据前10条,field以”\t”分割,并输出到hdfs指定路径。
create17
2019-03-12
9850
HUE简介及编译
Hue是一个开源的Apache Hadoop UI系统,最早是由Cloudera Desktop演化而来,由Cloudera贡献给开源社区,它是基于Python Web框架Django实现的。通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据,例如操作HDFS上的数据,运行MapReduce Job等等。很早以前就听说过Hue的便利与强大,一直没能亲自尝试使用,下面先通过官网给出的特性,通过翻译原文简单了解一下Hue所支持的功能特性集合:
create17
2019-03-12
3.7K0
如何在HUE上使用Spark Notebook
打开hue.ini文件,找到【yarn_clusters】【default】,修改spark_history_server_url值。
create17
2019-03-12
3.7K0
如何在HUE上通过oozie调用Hive SQL工作流
特别说明:该专栏文章均来源自微信公众号《大数据实战演练》,欢迎关注!
create17
2019-02-20
2.6K0
Sqoop概述及shell操作
基于传统关系型数据库的稳定性,还是有很多企业将数据存储在关系型数据库中;早期由于工具的缺乏,Hadoop与传统数据库之间的数据传输非常困难。基于前两个方面的考虑,需要一个在传统关系型数据库和Hadoop之间进行数据传输的项目,Sqoop应运而生。
create17
2019-02-17
1.3K0
Kylin基本原理及概念
“带你走进Apache Kylin的世界”
create17
2019-01-23
2.7K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档