首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

基于Ambari构建自己的大数据平台产品

目前市场上常见的企业级大数据平台型的产品主流的有两个,一个是Cloudera公司推出的CDH,一个是Hortonworks公司推出的一套HDP,其中HDP是以开源的Ambari作为一个管理监控工具,...我们公司最初是使用CDH的环境,近日领导找到我让基于Ambari做一个公司自己的数据平台产品。...后来想想如果公司如果有自己数据平台的产品后续在客户面前也能证明自己的技术实力且个人也能从源码级别更深入的学习了解大数据生态圈的各个组件。   个人在公司的数据平台从无到有的这个过程。...数据平台架构   数据平台按数据处理方式包含数据流处理和数据批处理两种方式,其中数据流处理采用Storm计算框架,目前建议做简单逻辑处理,计算结果仅用作实时数据展示,后续技术成熟可加入实时ML模块。...一键部署脚本编写   目前离线安装ambari需要提前准备好ambari、HDPHDP-util三个包构建本地yum源,然后通过yum安装ambari-server,还需安装配置关系型数据库。

1.4K30
您找到你想要的搜索结果了吗?
是的
没有找到

攻克的技术难题 - 如何快速搭建Hadoop3集群

我们生产中有两个Hadoop集群,规模在1200台主机左右,是基于Hadoop3的HDP版本。为什么不选择Apache版本的,个人认为有几个原因:1....安装HDP有一个后台管理平台,叫Ambari 。首先具有安装导向的作用,在页面安装时直接将所有IP/Hosts填入,然后选择每个节点安装哪些组件。...既然这么好,为什么这里不使用HDP?原因就是:HDP的软件包太大了。之前用docker搭建过HDP版本的Hadoop,需要下载四个软件包,大概12G左右,而Apache只有几百MB。...而且在安装过程中,Ambari会启动很多进程,进行Ambari Server与Agent的通信,就会导致电脑很卡。如果只是测试,那就使用HDP环境配置环境配置主要是对节点的配置,包括网络、防火墙等。...安装虚拟机下载Centos镜像,选择的版本是7,在VMware中进行虚拟机的安装配置。2.

42040

011.分布式可视化DAG工作流任务调度系统DolphinScheduler-1.3.3安装部署

集群已安装HDP3.1.4.0,Hadoop版本为3.1.1,不满足要求 Hive客户端 2.1+ 集群已安装HDP3.1.4.0,Hive版本为3.1.0,不满足要求 Spark客户端 1.x/2.x...集群已安装HDP3.1.4.0,Spark版本为2.3.2,满足要求 关于Ambari-2.7.4.0+HDP-3.1.4.0大数据平台的安装部署参考:基于CentOS7.8安装Ambari2.7+...这个是admin用户,此用户具有sudo权限,且在集群之间使用此用户可以互相免秘钥登录。...DolphinScheduler安装部署 3.1 准备工作 SSH免秘钥登录 的机器是hdp01-hdp04,统一使用admin用户进行安装,admin用户具有sudo权限,且hdp01机器可以通过admin...需要将hadoop的配置文件core-site.xml和hdfs-site.xml放到安装路径的conf目录下 # 本例即是放到/opt/apps/dolphinscheduler-1.3.3/conf

1.4K20

Ambari + HDP 整体介绍

Ambari + HDP介绍:         Ambari:WEB应用程序,后台为Ambari Server,负责与HDP部署的集群工作节点进行通讯,集群控制节点包括Hdfs,Spark,Zk,Hive...JDK,MySql 部署 (Hive相关表结构管理,如果没有用到Hive,无需安装)         3. Hadoop Hdfs 部署(修改配置) (分布式文件存储)         4....Spark,Flume,Sqoop等         部署缺点:以上全部部署都是通过命令行来部署,麻烦复杂,容易出错,动态扩展较难,无集群监控    部署优点:整体可控,对集群内部运行逻辑比较清楚,部署需要的服务...安装mysql,配置免密登陆         4. 安装httpd,配置本地ambari+HDP 的yum源         5. Ambari Server安装及初始化         6....Ambari Server 通过向导安装集群         7. Ambari 使用介绍         8. Hdfs HA的高可用         9.

17510

0481-如何从HDP2.6.5原地升级到CDH6.0.1

原地迁移到CDH5.16.1》迁移失败的补充,为什么迁移失败是因为HDP2.6.5的Hadoop版本2.7.5比C5的2.6要高导致的,HDFS支持升级,而不支持降级。...内容概述 1.测试环境说明 2.保存相关元数据 3.停止HDP和Ambari服务 4.卸载Ambari和HDP 5.安装Cloudera Manager 6.安装CDH 7.其他问题 测试环境 1.HDP2.6.5...为/hadoop/hdfs/namesecondary 具体参考《0480-如何从HDP2.6.5原地迁移到CDH5.16.1》 6 组件升级 1.根据上线章节完成安装CDH后在启动各项服务时依旧会报错如下...10 总结 首先强调一下本次迁移关注HDFS数据,Hive数据,HBase数据,对于以下内容并没办法保证从HDP到CDH的直接迁移,您需要新建或者进行更严格的测试: 1.用户认证如OpenLDAP,Kerberos...6.请一定保证Ambari和HDP都已经完全卸载,否则可能会导致CDH无法正常安装

1.4K20

【大数据版本对比】Hortonworks HDP2.x到3.x技术演进及版本梳理

HDP3.0默认安装包括Apache Ranger与Apache Atlas,目的是提供受信任以及安全的数据库。...还是那句话,论技术,不讨论。...HDP 3.0.0 看到了一些全新的变化,这是很好的开始,HDP产品化工作一直不如CDH,还是一个非常技术性的产品,并且对自身组件没有很强的把控能力,导致产品表现一直弱于CDH,长时间都在堆叠组件的道路上越走越远...3.7.1.3.适用于企业 1.能够在Ranger安装期间为管理员帐户指定密码 2.所有受支持的DB flavor的合并db schema脚本 3.在安装HDP3.0时,默认安装Ranger和Atlas...---- 6、HDP3.1.4,列举了常用的组件新特性 官网DOC: https://docs.cloudera.com/HDPDocuments/HDP3/HDP-3.1.4/release-notes

3K40

Spark Core入门1【Spark集群安装、高可用、任务执行流程、使用ScalaJavaLambda编写Spark WordCount】

二、Spark集群安装 2.1   下载spark (1)从spark官方下载spark安装包 (2)上传spark安装包到Linux上 (3)解压安装包到指定位置 tar -zxvf spark-2.3.3...集群规划:hdp-01,hdp-04是Master;hdp-02、hdp-03是Worker 安装配置zk集群,并启动zk集群 停止spark所有服务,修改配置文件spark-env.sh,在该配置文件中删掉...配置文件内容指定worker节点 2.在hdp-01上执行sbin/start-all.sh脚本,后在hdp-04上执行sbin/start-master.sh启动第二个Master【意味着hdp...: hdp-01为Master(alive)、hdp-02也为Master(stand by)  hdp-03、hdp-04、hdp-05为Worker  , 假设在机器hdp-05中提交了蒙特卡罗求...-1.0-SNAPSHOT.jar hdfs://hdp-01:9000/wordcount hdfs://hdp-01:9000/wordcount_res 需要注意的是:args(1),即结果存入HDFS

1.5K30

博主好贴心,为已有的 ambari 集群修改主机名~

根据官方文档和朋友提供的的实操步骤,也来实战演练一番。 二、节点说明 有两台 ambari 节点,主机名分别是 server.data,agent.data 。...其中 ambari-server 安装在 server.data 上;ambari-agent 两台均有安装。...或者直接通过 ambari 界面向导来安装某服务测试一下,或者直接在 shell 里面执行,yum install xxx,安装个东西测试一下。 这一步就不细说了,测试了一下,是可以正常安装的。...通过ambari 界面,去 hdfs 服务的配置里面搜了一下,发现配置又被更改了,如下图所示: ? 难道和刚才安装部署 knox 或者新服务有关?不知道了,需要大家去尝试了。...最后修改了 HDFS 的配置,将旧主机名替换为新主机名,已安装的所有的服务就都启动正常了。 ?

1.2K20

面试官:服务器安装 JDK 还是 JRE?可以安装 JRE

[format,png] 留心的同学可能会发现,我们的 jdk 安装成功后,在 C:\Program Files\Java 目录会是这样的(这里,是装的 jdk1.8 的版本) [format,png...] 而 jdk 的子目录下也存在一个 jre [format,png] 这两个不同版本的 jre 相互之间有什么联系?...只是很多人习惯将会单独安装另一个 jre,虽然单独安装的 jre 也并没有被使用,原因可能就是刚开始大家都不清楚 jdk 和 jre 之间的关系,所以就默认的都安装上了。...[format,png] 服务器上是否安装 JRE 就可以了? ----------------------- 另外一个问题,既然如此,那么在服务器上是否安装 JRE 就可以了?...服务器上安装 JRE 的前提: 发布到服务器上时所有文件都是编译好的文件,包括 JSP 文件 后期不在服务器上直接修改(因为导致修改后的文件未重新编译) 如果部署的项目都是编译后重新部署,不在服务器上直接修改的话是可以安装

2.4K60

眼前一亮的大数据毕业设计 来咯~

可视化安装、监控、管理所有集群。 HDP:3.1版本。其中包括Hadoop、HDFS、Yarn、Spark、Kafka、Zookeeper等服务。 MySQL:ambari元数据库。...*一个虚拟机可能需要占用20G存储,一个docker占用几百MB**。 只需要启动一台虚拟机即可。docker作为应用服务运行在这台虚拟机上。 其实,这里是建议使用3 ~ 4台虚拟机的。...这个centos_hdp就是自己构建的镜像,ports来开放容器的端口,volumes来挂载宿主机的目录。 3....下载安装在2016年毕业设计中,所搭建的大数据平台的各个组件都是独立下载安装的。Hadoop的安装包需要去Hadoop官网下载,Kafka安装包需要去Kafka官网下载。...想安装哪个版本就安装哪个版本。 基于Ambari安装,所有组件都包含在HDP安装包里,不过这个安装包挺大的,10G。

79020

Ambari安装Hadoop3遇到的一些新坑

Ambari安装Hadoop3遇到的一些新坑 以前使用HDP安装Hadoop集群安装了很多遍,本以为整个过程早已经烂熟于心,没想到这次安装过程还是遇到了新的坑,这里记录一下,分享给读者,以便不时之需。...Ambari自动生成的repo里源的url地址为空 表现出的现象为Ambari到了安装组件那一步一直过不去,前台报错日志提示ambari和hdp的repo url都为null,无有效的repo,图忘记截了...网上说的使用 --setopt=protected_multilib=false安装发现对来说并没有什么用。不同的环境各不相同 3....所以我们可以断定,虽然这一步已经运行结束,但是namenode服务不知道为何又挂掉了,百思不得其姐。 现在ambari停留在开启NN HA的界面,无法从前台去启停服务。...Please update hdfs configuration.

80910

Presto+Hive+Cos搭建大数据套件

image.png 本文主要介绍如何利用hdp工具搭建presto,并将hdfs替换成cos,运行presto。...2 HDP的搭建 利用ambari可视化工具进行安装,可参考如下文档,有详细的教程,本文不再赘述: https://docs.hortonworks.com/HDPDocuments/Ambari-2.6.2.2.../article/details/77585182 主要操作步骤是下载ambari-presto-xxx.tar.gz,放在hdp安装路径; 下载presto的rpm包,建立本地的repo,集成到ambari...presto的安装文件里面,然后就可以在hdp管理页面直接安装presto了: image.png 这里一定要注意,不要将coordinate和worker安装在同一个节点上面,否则会报错。...4 安装COSN插件: 去https://github.com/tencentyun/hadoop-cos/tree/master/dep 下载编译好的最新版本的两个lib,的hadoop版本是2.7.3

2.1K00

HAWQ技术解析(二) —— 安装部署

曾尝试在已有的CDH 5.7集群上源码编译安装HAWQ 2.0.0,过程可谓步履维艰,一步一坎,最终还是放弃了这个失败的安装方案。如果想挑战一下自己的心理承受能力或技术水平的同学,不妨尝试这种方式。...网上也有一些详细的资料可供参考,如“Apache HAWQ集群的安装部署”和“HAWQ手动安装”。推荐的方式是使用HDB介质,主要原因是过程相对简单,安装成功率高。 2....记住有以下限制: 每台主机都必须满足安装相应版本HAWQ的系统要求。 每个HAWQ segment所在主机必须和其上运行的HDFS DataNode协同工作。...记住有以下限制: PXF必须安装HDFS NameNode和所有HDFS DataNodes主机上。...如果配置了Hadoop HA,PXF必须安装在包括所有NameNode和所有HDFS Node的主机上。

2.3K50

HAWQ技术解析(九) —— 外部数据

在使用PXF访问HDFS文件前,确认已经在集群所有节点上安装了PXF HDFS插件(Ambari会自动安装),并授予了HAWQ用户(典型的是gpadmin)对HDFS文件相应的读写权限。 1....Avro 'CUSTOM'格式支持内建的(formatter='pxfwritable_import')格式属性。...在HAWQ和HDFS集群的所有节点上安装了PXF Hive插件。 如果配置了Hadoop HA,PXF也必须安装在所有运行NameNode服务的HDFS节点上。...在使用PXF访问JSON文件前,确认满足以下前提条件: 已经在集群所有节点上安装HDFS插件(Ambari会自动安装)。 已经在集群所有节点上安装了JSON插件(Ambari会自动安装)。...在使用PXF向HDFS文件写数据前,确认已经在集群所有节点上安装了PXF HDFS插件(Ambari会自动安装),并授予了HAWQ用户(典型的是gpadmin)对HDFS文件相应的读写权限。 1.

3.3K100

如何在Centos7.2安装HDP2.6

内容概述 1.集群服务器配置,包括安装操作系统、关闭防火墙、同步服务器时钟等; 2.外部数据库安装 3.安装Ambari管理器; 4.安装HDP集群; 5.集群完整性检查,包括 HDFS 文件系统...Ambari 3.1.配置Ambari和HDP本地yum源 ---- 1.准备好ambari和HDP安装包,并解压到/var/www/html目录下: [eepzxcdfx9.jpeg] [4ojfb18w6v.jpeg....选择HDP版本 ---- 这里使用HDP2.6,并配置HDP的Repository,这里使用的Local Repository: [ezlavlg45j.jpeg] 4.4.输入安装的主机,并输入Ambari...4.7.选择安装的服务 ---- 这里为了加快安装选了常用的几个服务: [8zj0x1acmv.jpeg] 4.8.分配服务Master角色 ---- 实际部署时需按规划设计进行分配: [itulcu96pq.jpeg...test]# hdfs dfs -mkdir /test mkdir: Permission denied: user=root, access=WRITE, inode="/test":hdfs:hdfs

3.2K190

Ambari HDP集群搭建全攻略「建议收藏」

将公钥写入authorized_keys文件中 ### 首先把所有的公钥都写入master服务器 ### 其次把master的公钥别写入slave1,slave2 ### 最后使用scp命令把口令告诉别人 (不会告诉你我的口令是...版本不然后面会有麻烦 **8、在这里面配置的是HDP2.4.3 ** 例子: http://public-repo-1.hortonworks.com/HDP/debian7/2.x/updates...12、直接使用Ambari默认分配方式 点击下一步开始安装 13、下面就是考虑网速的时候了 14、安装完成之后一路Next刷新主页面就看到了我们的Hadoop集群这里默认都是启动的 15、进入HDFS...下 点击restart ALL 可以重启所有组件 16、验证一下是否安装成功 点击NameNodeUI 17、基础信息页 18、Hadoop已经搭建完成完成了不想跑一个任务试试?...从服务器上传文件到hdfshdfs dfs -put 文件 /data/input/ ### 使用官网提供的例子进行测试 hadoop jar hdfs://tesla-cluster/data/

82840

搭建Spark高可用集群

SparkSQL:Spark Sql 是Spark来操作结构化数据的程序包,可以让使用SQL语句的方式来查询数据,Spark支持 多种数据源,包含Hive表,parquest以及JSON等内容。...spark安装 上传spark-安装包到Linux上 [root@hdp-01 ~]# wget https://d3kbcqa49mib13.cloudfront.net/spark-2.2.0-bin-hadoop2.7...(主节点): http://hdp-01:8080/ 到此为止,Spark集群安装完毕,但是有一个很大的问题,那就是Master节点存在单点故障,要解决此问题,就要借助zookeeper,并且启动至少两个...Master节点来实现高可靠 配置Spark集群之前一定要把zookper集群启动 Spark集群规划:hdp-01,hdp-02是Master;hdp-03,hdp-04是Worker 安装配置zk集群...hdfs hello yarn yarn hdfs [root@hdp-01 ~]# hadoop fs -mkdir -p /spark [root@hdp-01 ~]# hadoop fs -put

70520
领券