Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >基于Ambari的大数据平台解决方案:EDP,闪亮登场!

基于Ambari的大数据平台解决方案:EDP,闪亮登场!

作者头像
create17
发布于 2025-03-17 05:45:02
发布于 2025-03-17 05:45:02
2370
举报

大家好,我是create17,见字如面。今天给大家推荐一个大数据平台产品,它的名字就是EDP,由我们团队精心打造而成。能通过 Ambari 快速可视化部署新版 Apache Hadoop,跟随 Apache 各社区版本,适配了各种国产化系统,持续迭代更新,强烈推荐!

一、前言

以前,我们可以通过 Apache Ambari + HDP 的形式部署 Hadoop 各组件。但自从 hortonworks 与 cloudera 公司合并后,hdp 就闭源了,不再更新。

在这种背景下,大家迫切希望 Ambari 能支持对 Apache Hadoop 的可视化安装部署;也希望 Ambari 能支持更多的操作系统,比如国产化操作系统等。

经过团队小伙伴们的不懈努力,我们迭代开发的基于 Apache Ambari 的大数据平台解决方案能满足大部分企业的要求。我们将产品命名为 EDP,译为「企业级数据平台」。不只是Ambari的升级,也有大数据平台各服务的生产级解决方案。

二、EDP 简介

EDP,全称是 Enterprise Data Platform,是基于 Ambari 可视化部署的 Hadoop 生态的大数据组件集合,是一套成熟的企业级大数据平台解决方案。集大数据存储、处理和分析于一体。

EDP旨在提供一种一站式的解决方案,简化了Hadoop生态中各个组件的版本匹配、安装、集群管理以及监控等工作。对于那些需要处理大规模数据集的企业来说,EDP提供了一个可靠、高效且易于管理的平台。

可代替 hdp、cdh 等产品。跟随 Apache 各社区版本,支持多种国产化系统适配等。

三、EDP 广泛的操作系统支持

EDP 支持的操作系统如下:

● 主流系统:CentOS 7/8;Rocky 8/9;Ubuntu 22/24;Debian 10/11/12。

● 国产系统:银河麒麟 Kylin V10;统信 UOS 1050a/e;OpenEuler (多个版本);中科方德;Bc-Linux (多个版本);红旗 Asianux v7。

● 定制支持:理论支持所有国产操作系统,可根据需求定制。

四、EDP 丰富的大数据组件生态

EDP 与 HDP 组件版本对比:

五、EDP 亮点介绍

1、Ambari Python3、JDK17 与 Spring6 版本发布

此次版本发布了国内首个基于Python3JDK17Spring6的 Ambari 版本。以下是技术选型的原因及优势:

为什么使用 Python3?

  • Python2 已停止维护。
  • 更多操作系统已内置Python3,Ambari 支持了Python3,能方便适配各种操作系统。

为什么选择 JDK17?

  • 目前所有基于 Ambari 的大数据发行版(包括 HDP)仍使用 JDK8。
  • Oracle 官方已于 2021 年 12 月停止对 JDK8 的公共更新和支持,这意味着不再提供安全更新和官方维护。
  • JDK17 是官方发布的长期维护版本(LTS),更安全、更稳定。

为什么选择 Spring6?

  • HDP 的 Ambari 以及社区版 Ambari 使用的是 Spring5。
  • Spring5 的相关依赖(尤其是 Spring Security)存在大量 CVE 漏洞。根据 Maven 官方仓库统计,几乎所有版本都存在安全问题。
  • 对于安全要求较高的单位,升级 Spring5 到 Spring6 是必然选择,而这需要先升级 JDK 到 17。因此,我们推出了基于 JDK17 和 Spring6 的安全版本。

2、相对比HDP,版本升级与组件新增

EDP 相比较 HDP 已有组件,都做了版本升级。此外,EDP也新增了很多组件,可谓是诚意满满:

  • Alluxio:高性能分布式文件系统
  • Celeborn:弹性大数据计算引擎
  • CloudBeaver:DBeaver 的服务器版本。
  • Dolphin Scheduler:分布式任务调度系统。
  • Doris:MPP架构实时分析数据库
  • Flink:流处理和批处理框架
  • Impala:Hadoop SQL查询引擎
  • Kyuubi:数据湖查询服务网关
  • Seatunnel:分布式数据集成平台,ELT 框架。
  • Solr:全文搜索平台
  • Superset:数据探索与BI可视化工具。
  • VictoriaMetrics:高性能时序数据库
  • Nightingale:集群告警监控工具

3、Trino 升级

升级如下:

  • Trino 升级到最新版本,使用 JDK 22。
  • 集成了 Ranger 插件(此功能已通过 Trino 社区的 review,预计会在后续版本发布)。经内部合并测试无问题,具体内容可参考 Ranger 使用文档。

4、好用的监控工具

集成了国产最好用的监控告警组件 Nightingale。Nightingale 支持国内几乎所有通讯软件的告警,使用非常方便。其前身是滴滴开源的 Open Falcon,老运维应该会很熟悉。

5、版本支持

  • 免费版本
    • 支持大部分国产操作系统(基于 Radhat 8 内核,x86_64)。
    • 集成了很多大数据组件,满足普通用户的使用需求。
  • 商业版本
    • 支持更多操作系统:主流系统:CentOS 7/8;Rocky 8/9;Ubuntu 22/24;Debian 10/11/12。国产系统:银河麒麟 Kylin V10;统信 UOS 1050a/e;OpenEuler (多个版本);中科方德;Bc-Linux (多个版本);红旗 Asianux v7。
    • 支持 ARM 架构服务器。
    • 提供以下功能和服务:
      • 使用技术答疑与指导。
      • 集群组件相关技术支持,包括组件二次开发。
      • 集群参数优化。
      • 有部署工具,可支持一键傻瓜式部署,方便快捷。
      • Nightingale 大数据组件监控仪表盘配置文件。
    • 对于有二次开发需求的用户,提供全套自动化工具,屏蔽底层复杂性,降低上手门槛。例如:
      • 修改代码或升级组件。
      • 修复组件漏洞后,一键自动拉取代码仓库、编译并部署到测试集群,无需人工干预。

六、EDP 安装包分享

EDP 现对外免费开放,用户可使用EDP安装包,在内核版本是 redhat8 ,cpu架构是 x86_64 的操作系统上部署体验,对应的部署教程如下所示:

详细安装地址:

https://www.yuque.com/create17/edp/zoluwelwrvtge3c9

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-12-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据实战演练 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
大数据管理平台Ambari3.0最新版本二次开发入门实践指南
Apache Ambari项目初期旨在通过开发用于配置、管理、监控Hadoop集群的软件,使Hadoop集群管理更加简洁方便。因为Ambari灵活的插件化设计机制,现在已经广泛用于支持更多其他大数据组件的管理,用户可以根据需要自定义组件。Amabri提供直观且便于使用的Web管理界面,也提供RESTful API支持。
用户9421738
2025/04/26
790
大数据管理平台Ambari3.0最新版本二次开发入门实践指南
Ambari——大数据平台的搭建利器
Ambari 是什么 Ambari 跟 Hadoop 等开源软件一样,也是 Apache Software Foundation 中的一个项目,并且是顶级项目。目前最新的发布版本是 2.0.1,未来不久将发布 2.1 版本。就 Ambari 的作用来说,就是创建、管理、监视 Hadoop 的集群,但是这里的 Hadoop 是广义,指的是 Hadoop 整个生态圈(例如 Hive,Hbase,Sqoop,Zookeeper 等),而并不仅是特指 Hadoop。用一句话来说,Ambari 就是为了让
小莹莹
2018/04/23
1.3K0
Ambari——大数据平台的搭建利器
分享一下我对 ambari 二次开发的一些理解~
安装过 hadoop 集群的人都应该清楚,hadoop 生态从安装、配置到后期运维是一个非常艰辛的过程,一般来说安装 hadoop 可能就需要几天时间,运维一个小型集群同样需要几个人。ambari 和 cloudera Manager 这两个系统,目的就是简化 hadoop 生态集群的安装、配置,同时提高 hadoop 运维效率,以及对 hadoop 集群进行监控。
create17
2021/04/07
5K3
分享一下我对 ambari 二次开发的一些理解~
大数据架构:全网最全大数据架构生态
随着大数据行业的发展,大数据生态圈中相关的技术也在一直迭代进步,作者有幸亲身经历了国内大数据行业从零到一的发展历程,通过本文希望能够帮助大家快速构建大数据生态圈完整知识体系。
Freedom123
2024/03/29
7710
大数据架构:全网最全大数据架构生态
大数据平台:Ambari集群管理
Ambari是Hortonworks主导发行的开源管理平台,作为Apache顶级项目,Ambari也是最早且最成熟的大数据集群管理开源组件,可类比于Cloudera研发的CDH Manager。在容器化未盛行的时候,是商用(toB/toC)大数据平台构建的不二选择,用于简化Apache Hadoop集群的配置和管理。除了Hadoop集群,基于可扩展配置文件,用户可扩展自定义组件的部署和运行管理。Ambari 提供了一个易于使用的Web UI和API,使得系统管理员可以对集群进行监控、配置和管理。
Yiwenwu
2024/04/30
8530
大数据平台:Ambari集群管理
基于Ambari构建自己的大数据平台产品
  目前市场上常见的企业级大数据平台型的产品主流的有两个,一个是Cloudera公司推出的CDH,一个是Hortonworks公司推出的一套HDP,其中HDP是以开源的Ambari作为一个管理监控工具,CDH对应的是Cloudera Manager,国内也有像星环这种公司专门做大数据平台。我们公司最初是使用CDH的环境,近日领导找到我让我基于Ambari做一个公司自己的数据平台产品。最初接到这个任务我是拒绝的,因为已经有了很完善很成熟的数据平台产品,小公司做这个东西在我看来是浪费人力物力且起步太晚。后来想想如果公司如果有自己数据平台的产品后续在客户面前也能证明自己的技术实力且我个人也能从源码级别更深入的学习了解大数据生态圈的各个组件。
星哥玩云
2022/07/13
1.5K1
基于Ambari构建自己的大数据平台产品
五千字介绍 | 全网稀有的Ambari自定义服务集成实战(全)
自从 2020 年开始,我就发觉网上使用 Ambari 的同学多了很多,随着 cloudera 收购 hdp 并进入收费模式,越来越多的企业选择了 Ambari 来管理大数据平台,Ambari 集成第三方服务的需求也就变得越来越常见。
create17
2022/11/17
1.1K0
五千字介绍 | 全网稀有的Ambari自定义服务集成实战(全)
大数据平台01:Ambari2.7.5的编译和安装
终于,要开始写点大数据相关的文章了。当真的要开始写老本行的时候,还是考虑了挺久的。一是不知道从何处写起,二是如何能写点有意思的。
叫我阿柒啊
2022/05/09
1.1K0
大数据平台01:Ambari2.7.5的编译和安装
Ambari EDP 大数据集群部署手册
链接:https://pan.baidu.com/s/1M5SAVrL1DIy-dprE0g4OGA?pwd=b8hu
create17
2025/03/23
1570
Ambari EDP 大数据集群部署手册
Ambari 与 HDP 安装指南
大数据平台,涉及到很多软件产品,如果刚刚入行Hadoop,直接下载软件包,手动配置文件的方式,并没有那么直观和容易。
星哥玩云
2022/07/13
1.3K0
Ambari 与 HDP 安装指南
大数据Ambari自定义服务详细介绍
四年多前,入职一家大厂大数据部门主要工作就是从ambari集成大数据组件服务开始做起,当时需要把机器学习平台集成到大数据平台,当时把ambari进行了大量的修改,形成了一套完整的私有化平台,不仅是换了一层皮肤,而且把企业当中自研的组件和服务也集成进来,还在上面加入了用户登陆体系、安全认证体系、监控告警体系、license管理、自动增机器,在我看来应该是ambari最深入使用的一波人了。
house.zhang
2022/03/23
2K0
【大数据搭建HDP3.x】Ambari2.7.4+HDP3.1.4离线搭建教程(上)
上篇分享HDP3.1.4对照2.6.x的新特性,本篇文字整体分享下HDP3.1.4+Ambari2.7.4集群部署。各位看官走着~
知否大数据
2022/06/17
2.5K0
眼前一亮的大数据毕业设计 来咯~
好多人问我,这种「基于大数据平台的xxxx」的毕业设计要怎么做。这个可以参考之前写得关于我大数据毕业设计的文章大数据方向毕业设计,选题和实现思路。这篇文章是将对之前的毕设进行优化。
叫我阿柒啊
2022/12/18
9440
眼前一亮的大数据毕业设计 来咯~
Ambari 修改已集成服务的版本号,没有生效,如何解决?
今天给大家分享一个Ambari知识点。因为有好几位小伙伴最近都问了这个问题,所以特地整理一篇文章来回复这个问题,希望我的分享能给大家带来一些帮助和启发。
create17
2025/03/17
1000
Ambari 修改已集成服务的版本号,没有生效,如何解决?
CentOS7下利用Ambari搭建HDP大数据平台
Apache Ambari是一个基于Web的支持Apache Hadoop集群的供应、管理和监控的开源工具, Ambari已支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeeper、Sqoop和Hcatalog等。提供Web UI进行可视化的集群管理,简化了大数据平台的安装、使用难度。
yuanfan2012
2020/09/01
3.2K0
【技术革新】当古老的Ambari Metrics遇上现代监控:我们如何重构一个停滞不前的监控系统
在大数据领域,Apache Ambari作为一款成熟的集群管理工具已服务多年。然而,随着时间推移,它内置的监控系统——Ambari Metrics System (AMS)——却逐渐成为了运维团队的"心头痛"。
create17
2025/03/23
610
【技术革新】当古老的Ambari Metrics遇上现代监控:我们如何重构一个停滞不前的监控系统
使用Ambari搭建HDP集群完全参考手册
使用 ambari 来搭建 hdp 集群,前前后后搭了不下10遍,之前一直没有完整的总结整个过程,最近有空正好记录一下。
Lu说
2022/06/07
3.8K0
使用Ambari搭建HDP集群完全参考手册
大数据平台HDP搭建
在ambari的setup中我们可以选择使用默认的postgresql,也可以自定义使用其他数据库,此处选用mariadb,便于后期管理维护
KaliArch
2018/05/29
2.5K3
大数据平台HDP搭建
用户画像大数据环境搭建——从零开始搭建实时用户画像(四)
本章我们开始正式搭建大数据环境,目标是构建一个稳定的可以运维监控的大数据环境。我们将采用Ambari搭建底层的Hadoop环境,使用原生的方式搭建Flink,Druid,Superset等实时计算环境。使用大数据构建工具与原生安装相结合的方式,共同完成大数据环境的安装。
大数据流动
2020/06/02
3.2K0
用户画像大数据环境搭建——从零开始搭建实时用户画像(四)
007.基于CentOS7.8安装Ambari2.7+HDP3.1大数据平台
我这里创建了一个普通用户名为admin,并且具有sudo权限,4个节点都需要有这个用户。
CoderJed
2020/10/30
2.3K1
007.基于CentOS7.8安装Ambari2.7+HDP3.1大数据平台
推荐阅读
相关推荐
大数据管理平台Ambari3.0最新版本二次开发入门实践指南
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档