开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

machine1上的ubuntu (无hdfs)上安装的kylin可以连接到另一台机器上的Hbase和Hive吗？

基础概念

Kylin 是一个开源的分布式分析引擎，提供了超高速的大数据查询能力。它通过预计算技术（Cube）来优化查询性能，适用于大数据分析场景。

HBase 是一个分布式、可扩展、大数据存储系统，基于Google的Bigtable设计，适合存储非结构化和半结构化数据。

Hive 是一个基于Hadoop的数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供SQL查询功能。

相关优势

Kylin 的优势在于其高效的查询性能和预计算能力，适合需要快速响应的大数据分析。
HBase 的优势在于其高扩展性和对大数据的存储能力。
Hive 的优势在于其SQL接口和与Hadoop生态系统的集成，便于数据仓库的构建和管理。

类型

Kylin 是一个分析引擎。
HBase 是一个分布式数据库。
Hive 是一个数据仓库工具。

应用场景

Kylin 适用于需要快速查询大数据分析结果的场景，如商业智能（BI）报告、实时数据分析等。
HBase 适用于需要存储大量非结构化数据的场景，如日志数据、用户行为数据等。
Hive 适用于需要构建数据仓库并进行复杂查询的场景，如数据挖掘、报表生成等。

连接问题

在Ubuntu上安装的Kylin可以连接到另一台机器上的HBase和Hive，前提是满足以下条件：

网络连接：两台机器之间需要能够互相通信。
配置文件：需要在Kylin的配置文件中正确配置HBase和Hive的连接信息。
权限：确保Kylin有权限访问HBase和Hive。

配置示例

假设HBase和Hive分别运行在machine2上，以下是配置步骤：

配置HBase连接：编辑Kylin的配置文件$KYLIN_HOME/conf/kylin.properties，添加以下内容：
配置HBase连接：编辑Kylin的配置文件$KYLIN_HOME/conf/kylin.properties，添加以下内容：
配置Hive连接：编辑Kylin的配置文件$KYLIN_HOME/conf/kylin.properties，添加以下内容：
配置Hive连接：编辑Kylin的配置文件$KYLIN_HOME/conf/kylin.properties，添加以下内容：

常见问题及解决方法

连接超时：
- 检查网络连接是否正常。
- 检查防火墙设置，确保端口没有被阻止。
- 增加连接超时时间。

权限问题：
- 确保Kylin使用的用户有权限访问HBase和Hive。
- 检查HBase和Hive的配置文件，确保允许远程访问。
配置错误：
- 仔细检查配置文件中的IP地址、端口、用户名和密码是否正确。
- 确保配置文件的格式正确，没有语法错误。

参考链接

通过以上步骤和配置，你应该能够在Ubuntu上安装的Kylin连接到另一台机器上的HBase和Hive。如果遇到具体问题，可以根据错误信息进一步排查。

相关搜索:我可以在Redhat Linux机器上使用在Ubuntu上编译的共享库吗？32位库可以安装在用于Android开发的Ubuntu 16.04上吗？可以在同一台机器上同时安装windows和linux版本的android studio吗？如果我想在另一台没有安装python的机器上运行包含模块的python代码，我可以这样做吗？我可以在Ubuntu Linux上使用原生的react构建iOS和Android应用吗？我们可以在不同的机器上测试repo目录和opentest服务器吗？我可以在办公室局域网内的ubuntu机器上使用kubeadm设置kubernetes集群吗我可以在两台拥有一个许可证的机器上安装VS吗？我可以在另一台机器上保留Maven本地存储库并在我的项目中使用它吗？我在新安装的Ubuntu上同时安装了anaconda和miniconda。我应该预料到会遇到问题吗？可以通过安装在Heroku上的不一致机器人来播放音乐/声音吗？

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

Kylin集群模式部署（使用同一HBase存储）

觉得是由于Hive版本升级，hive命令行仅支持JDBC操作，所以需要输入用户名和密码所导致的Retrieving hive dependency…卡住。...启动 Kylin在基于默认配置的情况下启动需要依赖HDFS、YARN、MapReduce、Hive、HBase。...在启动kylin服务之前，还需要搞定以下两点：选择运行kylin服务的用户由于kylin的底层存储还是在HDFS上，所以建议大家还是使用hdfs用户来启动kylin服务，以避免在构建cubu过程中报...2. kylin配置假如现在我们有三台机器，在每一台机器里都安装一个kylin服务。使用同一HBase存储，用Nginx做负载均衡。将之前配置好的kylin源码拷贝至其余两台机器上的相同目录下。...关于Nginx的安装，需要提前编译，编译通过后才可以使用，并且依赖于当前目录。如果之后需要移动nginx目录的话，则需要再次编译nginx，才可以重新使用。

2.2K2 0

大数据学习过程中需要看些什么书？学习路线

Hadoop 架构、核心组件 HDFS/YARN 做了深入浅出的介绍，让你快速把握 Hadoop 的核心技术和工作原理，逐渐形成分布式思维； Hadoop 介绍 Hadoop 运行模式 3：Hadoop...行数据导入导出； Sqoop & Hive 课程内容介绍 Sqoop 介绍与安装 Sqoop 的基本使用 Sqoop 导入参数详解 Sqoop 导入实战 Sqoop 增量导入（上） Sqoop 增量导入...（下） Sqoop 导出实战（上） Sqoop 导出实战（下） Sqoop Job 7：Hive Hive，基于 Hadoop 大数据平台的数据仓库，可以让你实现传统数据仓库中的绝大部分数据处理、统计分析...定时调度 8：HBase HBase，列式存储数据库，提供了快速的查询方式，是 Apache Kylin 的默认数据存储结果； HBase 介绍及架构 HBase 安装 HBase 操作实战 Hive...与 HBase 集成实战 9：Kylin Kylin，基于 Hadoop 的 OLAP 分析引擎，在 Kylin 中可以实现传统 OLAP 的各种操作，直接读取 Hive 的数据或流式数据作为数据源

2.4K3 1

Kylin安装及使用

Kylin 1.6 CDH5.10 安装 Kylin有两种安装方式：单机及集群。本文以集群为例。单机版Kylin安装起来还是挺简单的，解压即安装。...1971 (kylin2.0中已解决) 维度表跟维度表之间也不要有相同的字段 7.不同的cube维度不能相同延伸关于MPP和Cube预处理的差异，重复如下： MPP 的基本思路是增加机器来并行计算...比如扫描8亿记录一台机器要处理1小时，但如果用100台机器来并行处理，就只要一分钟不到。再配合列式存储和一些索引，查询可以更快返回。...8亿记录的一个3维索引可能只有几万条记录，规模大大缩小，所以在线计算量大大减小，查询可以很快。索引表也可以采用列存储，并行扫描等MPP常用的技术。...但多维索引要对多维度的各种组合作预计算，离线建索引需要较大计算量和时间，最终索引也会占用较多磁盘空间。最后的最后，你知道，小省是谁吗？偷偷的告诉你，小省喊我去玩啦~~~

1.7K2 0

多套Kylin集群共享Hbase和Hadoop计算集群关键配置最佳实践

由于Kylin的本身架构（广播特性）和业务特点通常不适用于单套Kylin集群的节点过多，通常大家采用拆分Kylin集群但是共用底层的Hbase集群和计算集群的方式进行部署。...的安装目录。...此配置分为两部分，@为分隔符：（1）、@后的部分表示此Kylin集群使用什么作为存储，可以配置为：hbase、hdfs、ifile、jdbc。...当需要使用spark livy 构建时，配置kylin 构建jar包在HDFS上的位置。...database； b、kylin.source.hive.databasedir-for-flat-table 对应的hive database在hdfs上的路径，根据实际路径填写，由于database

9764 0

kylin 安装配置实验

七、在每个节点中配置如下环境变量： JAVA_HOME HADOOP_HOME HBASE_HOME HADOOP_HDFS_HOME HIVE_HOME HADOOP_COMMON_HOME JAVA_HOME...上执行以下命令 cd /home/grid/ tar -zxvf apache-kylin-1.5.1-HBase1.1.3-bin.tar.gz ln -s apache-kylin-1.5.1-...分别在三台机器上启动zookeeper /home/grid/zookeeper/bin/zkServer.sh start 2....2所示图2 查询执行和结果分别如图3、图4所示图3 图4 Build成功后，hive中建立了3个表，如图5所示图5 Build成功后，hbase中建立了2个表，如图6所示...图6 注意： 1. kylin、hadoop、hbase、hive的版本一定要匹配。

3092 0

【三歪教你些能装逼的】麒麟入门教程

没错，到这里就可以知道kylin的用途了：它可以在亚秒内查询巨大的表，来完成数据分析和决策每次跑Hive我们可能都得跑几分钟（像我SQL写得烂的，跑半小时也是经常有的事），我们从业务上就希望用来分析的数据可以跑得更快...OLAP所提供的工具框架还是很多的，下面我们来简单认识一下吧 ? 众所周知，执行Hive实际上是跑Map-Reduce任务去HDFS拿数据。执行的过程涉及到计算和存储。...（上图）「雪花形模型」：当有一个或多个维度表没有直接连接到事实表上，而需要通过其他维表连接到事实表（下图） ? 在kylin里，分析数据的角度叫做「维度」，被分析的指标叫做「度量」 ?...那kylin是将聚合的数据存储在哪的呢（肯定是有存储的地方的嘛）？在HBase上。如果还没学过HBase的同学，可以先看看我以往的文章：HBase入门 ?...使用kylin步骤：首先你得有数据（一般来自Hive/Kafka)，在Kylin上定义对应的数据模型(结构) 通过kylin系统配置需要聚合以及统计的字段（这块就是上面所提到的维度和度量），然后构建出

1.1K1 0

第一个“国产“Apache顶级项目——Kylin，了解一下!

依赖于 Hadoop、Hive、Zookeeper 和 Hbase ?...Kylin安装依赖环境从上面的架构中我们就可以看出，Kylin对于环境的依赖比较高软件版本 Apache hbase-1.1.1-bin.tar.gz 1.1.1 spark-2.2.0-bin...，我们需要下安装hbase 1.1.1版本下载hbase 1.1.1版本这里我已经下载好了，需要的朋友可以后台私信我 ?...初始化kylin在hdfs上的数据路径 hadoop fs -mkdir -p /apps/kylin 启动集群 1、启动zookeeper 2、启动HDFS 3、启动YARN集群 4...---- 小结 Kylin的简介以及安装部署的过程的内容到这里就结束了。大家需要在对kylin有所了解的基础上，搭建好kylin所需要的环境。

1.4K4 1

java转大数据的学习路线

集群（包括HDFS+MapReduce+Yarn）和Storm集群，不易于管理，所以出现了Spark这样的一站式的计算框架，既可以进行批处理，又可以进行流处理（实质上是微批处理）。...mahout库加MLlib R语言 Lambda 架构 Kappa架构 Kylin Alluxio 三、学习路径假设每天可以抽出3个小时的有效学习时间，加上周末每天保证10个小时的有效学习时间；...Zookeeper的原理以及选举机制。第二阶段（攻坚阶段） 4）Hadoop （《Hadoop 权威指南》）—80小时 HDFS HDFS的概念和特性。 HDFS的shell操作。...Hive 执行过程分析及优化策略 6）HBase（《HBase权威指南》）—20小时 hbase简介。 habse安装。 hbase数据模型。 hbase命令。 hbase开发。...hbase原理。 7）Scala（《快学Scala》）–20小时 Scala概述。 Scala编译器安装。 Scala基础。数组、映射、元组、集合。类、对象、继承、特质。模式匹配和样例类。

7363 0

什么是麒麟(kylin)？查数据贼快的哟

三歪第一反应想到的就是Hive（Hive底层是HDFS：支持超大规模的数据）。...没错，到这里就可以知道kylin的用途了：它可以在亚秒内查询巨大的表，来完成数据分析和决策每次跑Hive我们可能都得跑几分钟（像我SQL写得烂的，跑半小时也是经常有的事），我们从业务上就希望用来分析的数据可以跑得更快...（上图）「雪花形模型」：当有一个或多个维度表没有直接连接到事实表上，而需要通过其他维表连接到事实表（下图） image.png 在kylin里，分析数据的角度叫做「维度」，被分析的指标叫做「度量」 image.png...如果还没学过HBase的同学，可以先看看我以往的文章：HBase入门 image.png 使用kylin步骤：首先你得有数据（一般来自 Hive/ Kafka)，在 Kylin上定义对应的数据模型...） kylin会把数据存放在 HBase上，你可以通过 JDBC/ RESTful的方式来查询数据使用kylin 在官网上也列出比较常见的QA，大家可以看看：http://kylin.apache.org

1.1K2 0

hadoop生态圈相关技术_hadoop的生态

我们可以到apache官网上去下载，一般会链接到相关的镜像站点上（http://archive.apache.org/dist/）。...（2）java等编程语言：这个可以从两个角度来看，一是各个大数据组件都是由某种编程语言开发出来的，比如hdfs,hbase,hive等是用java语言开发出来的；比如spark,kafka等是用scala...获取Linux环境方式很多，如：在一台机器上安装Linux操作系统或 windows和Linux双操作系统可以在windows或linux操作系统的机器上安装虚拟机软件（如virualbox，vmware...等），然后创建linux操作系统的虚拟机可以直接在网上（如阿里、腾讯等）租赁一台Linux主机因为hadoop核心组件和很多组件都是基于Jvm运行的，所以机器上一定要安装java运行环境。...（2）单个组件的基础学习：先掌握单个组件（以及依赖组件）的安装和运行，开始可以先是单机安装，hadoop生态圈的各个组件基本都支持在一台机器上进行安装和运行，以便于简化开发阶段的环境准备。

7734 0

开源的分布式分析引擎 Kylin 2.0.0 的环境部署

前序：经过将近一周深夜调试到3、4点终于把环境配置好了（无数次的重新安装）囧。配置过程中也明白了很多关联的知识点，本文记录我成功搭建的过程。...- 交互式查询能力: 通过Kylin，用户可以与Hadoop数据进行亚秒级交互，在同样的数据集上提供比Hive更好的性能 - 多维立方体（MOLAP Cube）: 用户能够在Kylin里为百亿以上数据集定义数据模型并构建立方体...利用HBase Coprocessor - 基于HyperLogLog的Dinstinc Count近似算法 - 友好的web界面以管理，监控和使用立方体 - 项目及立方体级别的访问控制安全...安装过程：三个大步骤就可以完成环境的部署了，酒足饭饱，泡好茶客官准备开始咯： 1.更改服务器名称： 192.168.6.220 hadoop 这一行就是我们添加192.168.6.220 就是本地IP...，我们就可以访问： http://192.168.6.220:7070/kylin/ 帐号：ADMIN 密码：KYLIN 4.小体验： 1.用已经成功导入的样例Cube，进行build。

1.4K0 0

Kylin2.5.2完全分布式安装部署

Zookeeper，HBase，Hive 安装Hadoop这些组件的时候需要注意：选择的版本不能太低，根据Kylin官方推荐的版本来， Hadoop: 2.7+ Hive...OS: Linux only, CentOS 6.5+ or Ubuntu 16.0.4+ 笔者这里选用的版本如下： hadoop-2.7.2 hbase-1.2.11 ...zookeeper-3.4.6 jdk1.8.0_91 hive1.2.1 Kylin-2.5.2 2，Kylin下载与安装下载Kylin的时候，...mv apache-kylin-2.5.2-bin-hbase1x kylin2.5.2 解压完成后可以看到查看目录的文件夹有哪些： [root@mzz11 opt]# cd kylin2.5.2...Hive也需要配置环境变量，方法和Kylin相同。

5523 0

Hadoop集群安装注意事项

(2013年1月5日)近日在网上找到两篇关于Ubuntu下Hadoop单机和集群安装的文章，英文的可以用来参考一下： 1. http://www.michael-noll.com/tutorials/.../ 总体来说，跟单机版的差不多，只是配置文件需要做些修改，以及各个服务器之间可以无密码ssh切换。...所有机器的安装目录要保持一致，比如都是在~/hadoop/目录下，将hadoop添加到环境变量当中去，修改.bashrc,在后面添加： export HADOOP_HOME=/home/user/hadoop...JVM虚拟机最大内存的指定，默认是640M 所以也可以不设置，只有当你运行任务内存不够的时候设置这个值。...start-mapred.sh启动hadoop, 启动好之后，master机器上的进程还是跟单机版的一样有namenode, datanode, secondaryNameNode,jobtracker

2171 0

Kylin云端跨集群迁移实践

02 — 迁移前准备在目标集群中创建好hadoop大数据环境(hive/hbase/hadoop) 在目前集群中安装部署好kylin环境,确保kylin可以正常启动并build cube任务双方网络互通...,大数据拉取数据端口开放,可以正常拉取到源集群中的hdfs文件目前集群的kylin版本与源集群版本保持一致确保在目标集群中hive表已经构建且数据已经迁移完成提前准备好数据迁移的脚本,hdfs数据迁移.../hbase打快照快照/hbase快照恢复等脚本确保脚本在测试环境可以正常执行检查源端的kylin配置是否与目标端一致确认客户使用Kylin版本以及是否按照源版本安装 03 — Kylin迁移概述与方案制定...kylin迁移之前首先要确保在新环境中要具备大数据的组件的安装配置,kylin在启动时,会check hive/hive/hadoop的依赖配置,也可以通过export的方式制定....: 可以通过在新集群中绑定源集群的host ,让hbase restore之后,可以访问到对应源集群的hdfs文件.

9213 0

【硬刚Kylin】Kylin入门原理调优OLAP解决方案和行业典型应用

-3.1.0-bin-hbase1x 使用ADMIN/KYLIN的用户名和密码组合登陆Kylin后，用户可以使用sample cube来体验cube的构建和查询，也可以按照下面“基于hadoop环境安装使用...您需要准备一个配置好 HDFS，YARN，MapReduce，Hive， HBase，Zookeeper 和其他服务的 Hadoop 集群供 Kylin 运行。...但为了更好的稳定性，我们建议您将 Kylin 部署在一个干净的 Hadoop client 节点上，该节点上 Hive，HBase，HDFS 等命令行已安装好且 client 配置（如 core-site.xml...运行 Kylin 的 Linux 账户要有访问 Hadoop 集群的权限，包括创建/写入 HDFS 文件夹，Hive 表， HBase 表和提交 MapReduce 任务的权限。...操作系统要求： CentOS 6.5+ 或Ubuntu 16.0.4+ 软件要求： Hadoop 2.7+,3.0 Hive 0.13+,1.2.1+ Hbase 1.1+，2.0（从kylin 2.5

1.3K2 0

Kylin 大数据下的OLAP解决方案和行业典型应用

- Kylin 的原理和技术架构 - 1、Apache Kylin的原理和技术架构 Apache Kylin 从数据仓库中最常用的 Hive 中读取源数据，使用 MapReduce 作为...Kylin系统主要可以分为在线查询和离线构建两部分，具体架构图如下： 2、Kylin在百度地图的实践对于 Apache Kylin 在实际生产环境中的应用，在国内，百度地图数据智能组是最早的一批实践者之一...同时，计算集群一旦运行大任务，内存压力大的时候，HBase 就会性能非常差，为避免和计算集群互相影响，Kylin 集群依赖独立的 Hbase 集群。...同时，对 Hbase 集群做了相应的优化，包括：读写分离、SSD_FIRST 优先读取远程 SSD、并对依赖的 hdfs 做了相应优化。...当 kylin 上的 cube 越来越多，单台机器显然不能满足任务需求，除了任务数据有限制，任务多时也会互相影响数据构建的效率。通过修改 kylin 的任务调度策略，支持了多台机器同时构建数据。

1.3K2 0

Kylin 大数据下的OLAP解决方案和行业典型应用

Apache Kylin的原理和技术架构 Apache Kylin 从数据仓库中最常用的Hive中读取源数据，使用 MapReduce作为Cube构建的引擎，并把预计算结果保存在HBase中，对外暴露Rest...Apache Kylin系统主要可以分为在线查询和离线构建两部分，具体架构图如下： ?...同时，计算集群一旦运行大任务，内存压力大的时候，HBase 就会性能非常差，为避免和计算集群互相影响，Kylin 集群依赖独立的 Hbase 集群。...的当 kylin 上的 cube 越来越多，单台机器显然不能满足任务需求，除了任务数据有限制，任务多时也会互相影响数据构建的效率。通过修改 kylin 的任务调度策略，支持了多台机器同时构建数据。...我们通过增加配置项，可以使 kylin 强制关联维表，来过滤掉 olap 表中的脏数据； Kylin query 机器，查询或者聚合，会加载大量的数据到内存，内存占用大，甚至存在频繁 Full GC 的情况

6603 0

进阶指南｜三个月大数据工程师学习计划

集群（包括HDFS+MapReduce+Yarn）和Storm集群，不易于管理，所以出现了Spark这样的一站式的计算框架，既可以进行批处理，又可以进行流处理（实质上是微批处理）。...HDFS的概念和特性。...(在安装mysql的机器上执行) mysql -uroot -p #(执行下面的语句 *....usr/local/ys/app/ scp -r /usr/local/ys/app/kafka_2.11-0.8.2.2 ys04: /usr/local/ys/app/ 然后分别在各机器上创建软连...HBase配置是针对HA模式的hdfs 3.9.4将Hadoop的配置文件hdfs-site.xml和core-site.xml拷贝到HBase配置文件中 cp /usr/local

1.7K10 0

kylin安装---安装系列十一

承接安装系列hadoop，hive hive 与 kylin的搭建在原有hadoop+hbase+hive+spark基础上搭建 hive 配置环境变量添加如下：/etc/profile和 ~/.../lib/hive-hwi-1.1.0-cdh5.5.1.jar kylin 配置环境变量/etc/profile和 ~/.bash_profile...:7070 kylin.hbase.cluster.fs=hdfs://mycluster/apps/hbase/data kylin.route.hive.enabled=true kylin.route.hive.url...=jdbc:hive2://centos1:10000 kylin.monitor.hive.jdbc.connection.url=jdbc:hive2://centos1:10000 kylin.monitor.ext.log.base.dir...HADOOP_CLASSPATH:$f # else # export HADOOP_CLASSPATH=$f # fi #done 检查部署问题 check-env.sh find-hbase-dependency.sh

1852 0

第一个“国产“Apache顶级项目——Kylin，了解一下！

使用 Kylin 的公司 HBase安装 Kylin安装 Kylin的使用准备测试数据表导入测试数据指标和维度按照日期统计订单总额/总数量（Kylin方式）具体步骤： 1、创建 Project...高伸缩性和高吞吐率：单节点Kylin可实现每秒70个查询，还可以搭建Kylin的集群。 BI工具集成。Kylin可以与现有的BI工具集成。..._659643 《实践 | Kylin在滴滴OLAP引擎中的应用》 HBase安装在安装 Kylin 前需要先安装部署好 Hadoop、Hive、Zookeeper 和 HBase...① 在启动 Kylin 之前，需要先启动 Hadoop（HDFS、YARN、JobHistoryServer）、Zookeeper 和 HBase。...HDFS 和 YARN 的所有进程。

9103 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭