Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >基于Ambari的大数据平台解决方案:EDP,闪亮登场!

基于Ambari的大数据平台解决方案:EDP,闪亮登场!

作者头像
create17
发布于 2025-03-17 05:45:02
发布于 2025-03-17 05:45:02
2370
举报

大家好,我是create17,见字如面。今天给大家推荐一个大数据平台产品,它的名字就是EDP,由我们团队精心打造而成。能通过 Ambari 快速可视化部署新版 Apache Hadoop,跟随 Apache 各社区版本,适配了各种国产化系统,持续迭代更新,强烈推荐!

一、前言

以前,我们可以通过 Apache Ambari + HDP 的形式部署 Hadoop 各组件。但自从 hortonworks 与 cloudera 公司合并后,hdp 就闭源了,不再更新。

在这种背景下,大家迫切希望 Ambari 能支持对 Apache Hadoop 的可视化安装部署;也希望 Ambari 能支持更多的操作系统,比如国产化操作系统等。

经过团队小伙伴们的不懈努力,我们迭代开发的基于 Apache Ambari 的大数据平台解决方案能满足大部分企业的要求。我们将产品命名为 EDP,译为「企业级数据平台」。不只是Ambari的升级,也有大数据平台各服务的生产级解决方案。

二、EDP 简介

EDP,全称是 Enterprise Data Platform,是基于 Ambari 可视化部署的 Hadoop 生态的大数据组件集合,是一套成熟的企业级大数据平台解决方案。集大数据存储、处理和分析于一体。

EDP旨在提供一种一站式的解决方案,简化了Hadoop生态中各个组件的版本匹配、安装、集群管理以及监控等工作。对于那些需要处理大规模数据集的企业来说,EDP提供了一个可靠、高效且易于管理的平台。

可代替 hdp、cdh 等产品。跟随 Apache 各社区版本,支持多种国产化系统适配等。

三、EDP 广泛的操作系统支持

EDP 支持的操作系统如下:

● 主流系统:CentOS 7/8;Rocky 8/9;Ubuntu 22/24;Debian 10/11/12。

● 国产系统:银河麒麟 Kylin V10;统信 UOS 1050a/e;OpenEuler (多个版本);中科方德;Bc-Linux (多个版本);红旗 Asianux v7。

● 定制支持:理论支持所有国产操作系统,可根据需求定制。

四、EDP 丰富的大数据组件生态

EDP 与 HDP 组件版本对比:

五、EDP 亮点介绍

1、Ambari Python3、JDK17 与 Spring6 版本发布

此次版本发布了国内首个基于Python3JDK17Spring6的 Ambari 版本。以下是技术选型的原因及优势:

为什么使用 Python3?

  • Python2 已停止维护。
  • 更多操作系统已内置Python3,Ambari 支持了Python3,能方便适配各种操作系统。

为什么选择 JDK17?

  • 目前所有基于 Ambari 的大数据发行版(包括 HDP)仍使用 JDK8。
  • Oracle 官方已于 2021 年 12 月停止对 JDK8 的公共更新和支持,这意味着不再提供安全更新和官方维护。
  • JDK17 是官方发布的长期维护版本(LTS),更安全、更稳定。

为什么选择 Spring6?

  • HDP 的 Ambari 以及社区版 Ambari 使用的是 Spring5。
  • Spring5 的相关依赖(尤其是 Spring Security)存在大量 CVE 漏洞。根据 Maven 官方仓库统计,几乎所有版本都存在安全问题。
  • 对于安全要求较高的单位,升级 Spring5 到 Spring6 是必然选择,而这需要先升级 JDK 到 17。因此,我们推出了基于 JDK17 和 Spring6 的安全版本。

2、相对比HDP,版本升级与组件新增

EDP 相比较 HDP 已有组件,都做了版本升级。此外,EDP也新增了很多组件,可谓是诚意满满:

  • Alluxio:高性能分布式文件系统
  • Celeborn:弹性大数据计算引擎
  • CloudBeaver:DBeaver 的服务器版本。
  • Dolphin Scheduler:分布式任务调度系统。
  • Doris:MPP架构实时分析数据库。
  • Flink:流处理和批处理框架
  • Impala:Hadoop SQL查询引擎
  • Kyuubi:数据湖查询服务网关
  • Seatunnel:分布式数据集成平台,ELT 框架。
  • Solr:全文搜索平台
  • Superset:数据探索与BI可视化工具。
  • VictoriaMetrics:高性能时序数据库
  • Nightingale:集群告警监控工具

3、Trino 升级

升级如下:

  • Trino 升级到最新版本,使用 JDK 22。
  • 集成了 Ranger 插件(此功能已通过 Trino 社区的 review,预计会在后续版本发布)。经内部合并测试无问题,具体内容可参考 Ranger 使用文档。

4、好用的监控工具

集成了国产最好用的监控告警组件 Nightingale。Nightingale 支持国内几乎所有通讯软件的告警,使用非常方便。其前身是滴滴开源的 Open Falcon,老运维应该会很熟悉。

5、版本支持

  • 免费版本
    • 支持大部分国产操作系统(基于 Radhat 8 内核,x86_64)。
    • 集成了很多大数据组件,满足普通用户的使用需求。
  • 商业版本
    • 支持更多操作系统:主流系统:CentOS 7/8;Rocky 8/9;Ubuntu 22/24;Debian 10/11/12。国产系统:银河麒麟 Kylin V10;统信 UOS 1050a/e;OpenEuler (多个版本);中科方德;Bc-Linux (多个版本);红旗 Asianux v7。
    • 支持 ARM 架构服务器。
    • 提供以下功能和服务:
      • 使用技术答疑与指导。
      • 集群组件相关技术支持,包括组件二次开发。
      • 集群参数优化。
      • 有部署工具,可支持一键傻瓜式部署,方便快捷。
      • Nightingale 大数据组件监控仪表盘配置文件。
    • 对于有二次开发需求的用户,提供全套自动化工具,屏蔽底层复杂性,降低上手门槛。例如:
      • 修改代码或升级组件。
      • 修复组件漏洞后,一键自动拉取代码仓库、编译并部署到测试集群,无需人工干预。

六、EDP 安装包分享

EDP 现对外免费开放,用户可使用EDP安装包,在内核版本是 redhat8 ,cpu架构是 x86_64 的操作系统上部署体验,对应的部署教程如下所示:

详细安装地址:

https://www.yuque.com/create17/edp/zoluwelwrvtge3c9

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-12-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据实战演练 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
docker总结
Docker 是一个开源的应用容器引擎,基于 Go 语言 并遵从 Apache2.0 协议开源。
Dlimeng
2023/06/30
2320
docker总结
Docker2 docker commit方法镜像制作
一、前期准备 1.下载一个centos镜像,进入容器,安装wget docker pull centos docker run -it centos bash [root@web1 ~]# docker run -it centos bash #进入容器 [root@4f1f1ca319f2 /]# [root@4f1f1ca319f2 /]# [root@4f1f1ca319f2 /]# cd [root@4f1f1ca319f2 ~]# ls anaconda-ks.cfg [root@
Java帮帮
2019/11/25
5600
走进Docker的世界--(库存学习笔记)
介绍docker的前世今生,了解docker的实现原理,以Django项目为例,带大家如何编写最佳的Dockerfile构建镜像。通过本章的学习,大家会知道docker的概念及基本操作,并学会构建自己的业务镜像,并通过抓包的方式掌握Docker最常用的bridge网络模式的通信。
误入歧途
2024/05/08
2240
【docker深入浅出】一文学透Docker基础万字好文
Docker 最初是dotCloud公司创始人Solomon Hykes在法国期间发起的一个公司内部项目,它是基于dotCloud公司多年云服务技术的一次革新,并与2013年3月以Apache 2.0授权协议开源),主要项目代码在GitHub上进行维护。Docker项目后来还加入了Linux基金会,并成立推动开放容器联盟。
iOS Magician
2023/10/11
5540
【docker深入浅出】一文学透Docker基础万字好文
docker的常用命令汇总_Docker命令
Web 应用的自动化打包和发布。 自动化测试和持续集成、发布。 在服务型环境中部署和调整数据库或其他的后台应用。 从头编译或者扩展现有的 OpenShift 或 Cloud Foundry 平台来搭建自己的 PaaS 环境。
全栈程序员站长
2022/09/29
8860
docker的常用命令汇总_Docker命令
docker浅入深出
Docker 层利用了Linux容器技术(LXC)(在操作系统中实现资源隔离与限制)。为了方便创建和管理这些容器,dotCloud 开发了一套内部工具,之后被命名为“Docker”。Docker就是这样诞生的。
萧晚歌
2020/08/27
8070
docker浅入深出
docker的/var/run/docker.sock参数
在创建docker容器时,有时会用到/var/run/docker.sock这样的数据卷参数,例如以下docker-compose.yml,可以看到kafka容器的数据卷参数带有/var/run/docker.sock:
程序员欣宸
2019/07/02
7.2K0
docker的/var/run/docker.sock参数
Kubernetes全栈架构师(Docker基础)--学习笔记
Docker:它是一个开源的软件项目,在Linux操作系统上,docker提供了一个额外的软件抽象层及操作系统层虚拟化的自动管理机制。
郑子铭
2021/07/25
1.4K0
Kubernetes全栈架构师(Docker基础)--学习笔记
简单易懂的Docker基础知识
虚拟化和云计算已经是一个很火热技术话题了,基于虚拟化技术,我们可以实现对硬件资源的充分利用,实现对软件运行环境的隔离。但是传统的虚拟化技术,基本都是通过虚拟一个个单独的操作系统来实现虚拟化的需求。这虽然在一定程度上增加了硬件资源的利用率,但是这样的虚拟化解决方案,有时却显得不是那么聪明,在许多场景下依然显得很笨重,相比于应用软件的开销,有可能虚拟机系统的开销比应用本身还要高。所以,在一些轻量化的场景下,当前的虚拟化技术就无法很好的发挥其作用了。这个问题随着Docker的出现,拥有了更为完美的解决方案。
后场技术
2020/09/03
5700
简单易懂的Docker基础知识
n1.Docker命令参数一览表
描述:利用 docker info 命令 Docker Client && Docker Server 信息一览:
全栈工程师修炼指南
2020/10/23
2.2K0
n1.Docker命令参数一览表
Docker Review - docker 容器 常用命令
https://docs.docker.com/engine/reference/commandline/run/
小小工匠
2021/10/08
3360
Docker容器学习梳理--基础知识(1)
Docker是PaaS 提供商 dotCloud 开源的一个基于 LXC 的高级容器引擎,源代码托管在 Github 上, 基于go语言并遵从Apache2.0协议开源。 Docker是通过内核虚拟化
洗尽了浮华
2018/01/22
1.5K0
Docker容器学习梳理--基础知识(1)
Docker容器镜像仓库存储原理(前世今身)与搬运技巧
在深入学习镜像之前我们需要知道镜像是如何(炼制/搓)成的(等同于构建镜像),当然是通过我们DockerFile一条条指令为镜像生成每一层,按照执行顺序镜像文件系统复写封装从下到上;
全栈工程师修炼指南
2022/09/29
3.5K0
Docker容器镜像仓库存储原理(前世今身)与搬运技巧
Docker4-docker私库的搭建及常用方法-docker-registry方式
前面已经介绍,可以使用Docker Hub公共仓库,但是大多数情况企业都需要创建一个本地仓库供自己使用。这里介绍几种搭建私库的方法
Java帮帮
2019/12/13
1.8K0
Docker4-docker私库的搭建及常用方法-docker-registry方式
Docker快速入门总结笔记
(1)基本介绍 Docker 是一个开源的应用容器引擎,基于 Go 语言 并遵从 Apache2.0 协议开源。
全栈程序员站长
2022/09/07
6100
【前端部署附录一】写给前端的 docker 使用指南
大家好,我是山月,这是我最近新开的专栏:「前端部署系列」。包括 Docker、CICD 等内容,大纲图示如下
山月
2022/11/02
3540
【前端部署附录一】写给前端的 docker 使用指南
【Docker】Docker常见命令汇总
命令帮助文档:Reference documentation | Docker Documentation
宝耶需努力
2022/12/13
1.1K0
Docker 底层原理浅析
作者:vitovzhong,腾讯 TEG 应用开发工程师 容器的实质是进程,与宿主机上的其他进程是共用一个内核,但与直接在宿主机执行的进程不同,容器进程运行在属于自己的独立的命名空间。命名空间隔离了进程间的资源,使得 a,b 进程可以看到 S 资源,而 c 进程看不到。 1.  演进 对于统一开发、测试、生产环境的渴望,要远远早于 docker 的出现。我们先来了解一下在 docker 之前出现过哪些解决方案。 1.1 vagrant Vagarant 是笔者最早接触到的一个解决环境配置不统一的技术方
腾讯技术工程官方号
2020/11/05
1.8K0
Docker容器技术
Docker介绍 什么是容器 Linux容器是与系统其他部分隔离开的一系列进程,从另一个系统镜像运行,并由该镜像提供支持进程所需的全部文件。 容器镜像包含了应用的所有依赖项,因而在从开发到测试再到生产的整个过程中,它都具有可移植性和一致性。 来源:https://www.redhat.com/zh/topics/containers/whats-a-linux-container 容器就是虚拟化吗? 虚拟化使得许多操作系统可同时在单个系统上运行。 容器只能共享操作系统内核,将应用进程与系统其他部分,隔离开。
863987322
2018/03/29
3.5K0
Docker容器技术
为什么会是Docker?
最近Docker容器化部署特别火热,那为什么说Docker是下一代的容器工具?回答这个问题之前,我们就服务器的历史演变来简单说明一下。
架构精进之路
2020/08/17
6030
为什么会是Docker?
相关推荐
docker总结
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档