首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

无网络接入的CDH集群如何安装parckage(如mmlspark)?

在无网络接入的CDH(Cloudera Distribution Hadoop)集群中安装软件包(如mmlspark)是一个具有挑战性的任务,因为通常这些软件包需要从互联网上下载。然而,通过一些预先准备和手动步骤,你仍然可以在这样的环境中完成安装。以下是一个详细的指南:

基础概念

  • CDH集群:Cloudera Distribution Hadoop,一个流行的Hadoop发行版,包含了Hadoop及其生态系统中的多个组件。
  • mmlspark:Microsoft Machine Learning for Apache Spark,一个为Spark提供机器学习功能的库。
  • 无网络接入:指的是集群无法直接访问互联网,这限制了从在线仓库下载软件包的能力。

相关优势

  • 离线安装:允许在没有网络连接的环境中安装必要的软件包,确保集群的稳定性和安全性。
  • 减少依赖:通过预先下载所有必需的组件,可以减少安装过程中对外部服务的依赖。

类型与应用场景

  • 类型:离线软件包安装。
  • 应用场景:企业内部网络隔离环境、远程数据中心、灾难恢复站点等。

解决方案步骤

  1. 准备环境
    • 在一个可以访问互联网的机器上,下载mmlspark及其所有依赖项。
    • 将下载的文件复制到一个外部存储设备(如USB驱动器)。
  • 传输文件到CDH集群
    • 将外部存储设备连接到CDH集群的节点。
    • 将下载的mmlspark及其依赖项复制到集群的适当位置,通常是/var/lib/hadoop-hdfs/或指定的软件仓库目录。
  • 安装软件包
    • 在CDH集群的节点上,导航到mmlspark的安装目录。
    • 运行安装脚本或手动配置环境变量和类路径,以便Spark可以找到并加载mmlspark库。
  • 验证安装
    • 启动一个Spark会话,并尝试导入mmlspark包以验证其是否正确安装。
    • 运行一些简单的测试用例来确保mmlspark的功能正常。

可能遇到的问题及解决方法

  • 依赖项缺失:如果在安装过程中遇到依赖项缺失的问题,需要回到准备环境步骤,确保所有必需的依赖项都已下载并传输到集群。
  • 版本不兼容:确保下载的mmlspark版本与CDH集群中的Spark版本兼容。如果不兼容,可能需要寻找替代方案或升级集群组件。
  • 权限问题:在复制文件和运行安装脚本时,可能会遇到权限问题。确保以适当的用户身份执行这些操作,或调整文件和目录的权限设置。

参考链接

请注意,具体的安装步骤可能因集群配置和软件版本的不同而有所差异。建议参考官方文档和社区论坛以获取更详细的指导和支持。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

0721-5.10.0-CM接管rpm方式安装的无CM的CDH集群

文档编写目的 在部署CDH集群时,可能使用tar包或者rpm包的方式安装的集群,但是在部署时并没有采用Cloudera Manager来对集群进行管理,在使用过程中,集群数据量日益增长,组件慢慢变多,因此想将现有的集群使用...Cloudera Manager来进行管理,本文档将介绍如何使用Cloudera Manager来接管一个无Cloudera Manager管理的CDH集群。...测试环境: · CM和CDH版本为5.10.0 · 操作系统版本为RedHat7.2 · 使用root用户进行操作 · 集群一共三个节点 CDH集群以rpm方式已经安装的组件如下: · Zookeeper...出现的两个警告是由于使用rpm的方式安装了CDH集群,并不影响 16.安装服务页面,在此处不选择添加任何服务,在后面再进行服务的添加 ? 17.点击左上角,回到CM主页 ?...总结 1.使用CM接管未受管的CDH集群,在添加服务时需要注意的是,要保持角色与之前安装时的角色一致,数据目录也需要指定成之前安装时的数据目录,以及一些配置也需要在CM上修改,与支持一致,保证CM接管后服务都与之前一样正常运行

1.2K20

0724-6.2.0-CM接管rpm方式安装的无CM的CDH集群

文档编写目的 在之前的文档中介绍了如何用CM接管无CM以rpm方式安装的CDH5.10.0,本文档同样会介绍如何使用Cloudera Manager来接管一个无Cloudera Manager管理的CDH...集群,只不过这次的版本是CDH6.2.0。...测试环境: CM和CDH版本为6.2.0 操作系统版本为RedHat7.2 使用root用户进行操作 集群一共三个节点 CDH集群以rpm方式已经安装的组件如下: Zookeeper HDFS Yarn...出现的警告是由于使用rpm的方式安装了CDH集群,并不影响 17.安装服务页面,在此处不选择添加任何服务,在后面再进行服务的添加 ? 18.点击左上角,回到CM主页 ?...3.使用CM接管原集群后,能够通过CM更好的监控集群服务的状态以及使用情况,方便更好的对集群进行管理。

1K40
  • 如何编译Livy并在非Kerberos环境的CDH集群中安装

    ,基于Apache Spark的开源REST服务,加入Cloudera Labs》,由于Cloudera暂未将Livy服务打包集成到CDH,所以需要我们自己编译安装,本篇文章主要介绍如何通过Maven编译...Livy并在非Kerberos环境的CDH集群中安装。...R和Python环境变量 这里R和Python的安装及配置这里就不多讲了,可以参考Fayson前面的文章《如何在Redhat中配置R环境》和《如何在CDH集群安装Anaconda&搭建Python私有源...[pa8k4d2qhv.jpeg] 到此为止就完成了Livy源码编译、安装与非Kerberos环境下的CDH集群集成。...7.总结 ---- 部署Livy的节点需要安装CDH的GateWay工具 Livy工程的编译的依赖环境需要配置否则在编译时会报错,具体可以参考如下: https://github.com/cloudera

    2.3K60

    0686-6.2.0-如何为CDH集群的JDK安装JCE策略文件

    本篇文章Fayson主要介绍使用不同方式安装JCE加密策略文件以及如何禁用Kerberos的AES-256加密。...测试环境: 1.Redhat7.2 2.采用root用户操作 3.CM/CDH6.2.0 手动安装JCE Policy File 1.确认当前CDH集群使用的JDK路径 可以使用“ps -ef”命令查看启动的...当前CDH5集群只有这一个JDK安装包 ? 再通过CM引导界面为JDK安装JCE ? ? 安装完成后,可以看到集群所有节点都新安装了Oracle JDK 1.7 ?...2.JDK 1.8.0_161或更高版本的JDK是不需要再安装JCE Policy File,默认已默认启用无限强度加密。 3.可以通过手动或CM引导的方式为CDH集群的JDK安装JCE策略文件。...5.通过前面的测试发现通过CM的引导界面来为CDH集群的JDK安装JCE策略文件,只能为升级向导中同时安装的JDK(即CM默认自带的JDK)添加JCE策略文件,如果集群使用自定义的JDK版本则需要通过手动的方式安装

    1.3K30

    如何在CDH集群的非元数据库节点安装MySQL5.7.12

    1.文档编写目的 ---- 在CDH集群中默认使用的MySQL版本是操作系统自带的版本,一般操作系统自带的MySQL版本都会比较低,对于企业已有应用可能会用较新的MySQL版本,使用集群中安装的MySQL...时可能会出现SQL不兼容的问题,那么解决方法一是在集群中安装新版本的MySQL,二是升级集群中老版本的MySQL。...本文主要选择第一种方法在集群中安装新版本的MySQL,在RedHat6安装时会遇到mysql-community-libs包冲突的问题,卸载冲突包时会将cloudera-manager-agent包也卸载导致...Agent异常,在RedHat7安装时会自动更新mysql-community-libs依赖包,本文档主要讲述基于RedHat7.2系统的CDH集群中的非元数据库节点安装MySQL5.7.12。...那么在RedHat6操作系统安装MySQL新版本的时候如何解决依赖包冲突问题及确保Agent服务正常会在后续的文章做详细说明。 醉酒鞭名马,少年多浮夸! 岭南浣溪沙,呕吐酒肆下!

    1.1K60

    如何无网络下免编译的安装程序(RPM包)

    摘要:rpm包是预先在Linux主机上编译好并打包的文件,安装起来非常快捷。不需要再进行繁琐的编译等操作,拿来就能用,区别于yum包管理,rpm可以在不需要网络环境的情况下使用。...安装rpm-build sudo yum install -y gcc make rpm-build redhat-rpm-config vim lrzsz 在无网络的机器上装备环境 需要在无网络的情况下解决一些依赖包的环境可以使用以下命令提前在一台有网络的机器上下载好...RPM包再到无网络的机器上安装就可以了 yum install --downloadonly --downloaddir= 创建必须的文件夹和文件 mkdir -p ~/...: 依赖的软件, 安装的时候需要检查的 Packager: 软件的打包者 Vendor: 软件发行商或者打包组织信息,如(Apache Software Foundation) %description...无网络时提前在有网络的机器上下载好依赖包就好啦 引用 How to create an RPM package/zh-hk CentOS6下rpm打包实战 Centos 6 制作 rpm 包 Linux

    2.2K170

    大规模集群下,如何快速实现无死角网络连通性的主动巡检

    02 传统网络主动巡检痛点主动巡检多采用手工方式,通过 CLI 工具或者脚本,向集群主动注入压力,获取集群响应情况,因此存在很多不足之处。...对于大规模 k8s 集群,希望确认所有节点间 POD 的网络连通性,避免某个节点存在网络故障,发现网络中是否存在偶发丢包问题,而通信渠道非常多,包括 Pod IP、ClusterIP、NodePort、...对于不同的应用需要使用不同的工具检查,如 dns 服务、业务应用服务、磁盘等,需要运维人员对不同的巡检工具有深入了解,大大提高了运维人员的门槛。...kdoctor 会绑定相对应的资源目标,如 ingress 、service,每一个 agent pod 根据任务配置相互访问绑定的资源,根据请求结果得出结论 。...安装 kdoctor。

    27810

    0787-6.3.3-如何在本地集群安装Workload Experience Manager(WXM)

    关于Workload XM是如何与其他集群交互以及在本地安装Workload XM实例所依赖的服务可在如下架构图中体现: ?...此部署方式最大程度的减少对集群的影响,并避免了升级CDH集群以满足WXM部署的需求。因此建议使用独立的集群安装部署WMX,对于集群的硬件配置及OS版本要求如下: ?...集群接入WXM 在前面已经成功的安装了Workload XM服务,也能通过浏览器正常访问Web界面,新装的WXM里面是没有任何数据的,这里我们需要在被接入诊断分析的集群安装Telemetry Publisher...服务,接下来Fayson已CDH6.3.3集群为例介绍如何安装TP服务并进行配置。...、Yarn、Zookeeper、HDFS服务 4.Workload XM服务可以同时接入诊断分析多个CDH或CDP集群 5.需要接入Workload XM诊断分析的集群,必须需要在集群的Cloudera

    1.6K20

    0523-5.15-为Cloudera Manager配置自定义告警脚本

    1 文档编写目的 Cloudera Manager支持三种方式的告警输出,在前面的文章《如何为CDH集群配置警报邮箱》和《如何通过Cloudera Manager配置使用SNMP方式转发告警》...Fayson介绍了邮件和SNMP两种方式的告警接入,那Cloudera Manager还支另外一种自定义告警脚本方式接入告警,本篇文章Fayson主要介绍如何使用自定义告警脚本的方式将CM告警输出。...测试环境 1.CM和CDH版本为5.15.0 前置条件 1.CDH集群使用Cloudera Manager管理 2 环境准备 这里在Cloudera Management Service下的Alert...Publisher服务所在节点安装了jq命令,主要用于解析JSON格式的数据。...4 告警脚本测试 1.在集群中手动的kill掉几个服务的进程 ?

    2K10

    0720-5.10.0-如何在RedHat7.2使用rpm安装CDH(有CM)

    文档编写目的 在上一篇文档《5.10.0-如何在RedHat7.2使用rpm安装CDH(无CM)》中介绍了如何在没有CM的情况下使用rpm的方式安装CDH集群,本文档将介绍如何使用CM以rpm的方式安装...环境介绍: · 安装部署使用root用户进行操作 · 安装的CDH和CM版本为5.10.0 · OS为RedHat7.2 · CDH集群的三个节点信息如下: ?...安装前置准备 2.1 服务相关设置 安装CDH集群时需要做一些前置的准备,本次安装使用的环境已经做好前置准备,需要做的准备如下: 1.hosts以及hostname配置正确 2.服务器没有启用IPv6且配置了静态...2.2 配置本地yum源 在官网下载好安装CDH集群需要的rpm包,地址如下: http://archive.cloudera.com/cdh5/redhat/7/x86_64/cdh/5.10.0/RPMS...指定CM的自定义存储库 ? 7.JDK的安装 ? 8.单用户模式,这里不选择 ? 9.输入主机密码 ? 10.集群安装需要的包 ? ? 11.检测CDH版本 ? 12.检查主机正确性 ?

    64930

    0723-6.2.0-如何在RedHat7.2使用rpm安装CDH(有CM)

    文档编写目的 在之前的文档《0722-6.2.0-如何在RedHat7.2使用rpm安装CDH(无CM)》中介绍了如何在CM上使用rpm的方式安装CDH6.2.0集群,本文档将介绍如何在CM上使用rpm...的方式安装CDH6.2.0集群。...环境介绍: 安装部署使用root用户进行操作 安装的CDH和CM版本为6.2.0 OS为RedHat7.2 CDH集群的三个节点信息如下: ?...安装前置准备 2.1 服务器相关设置 安装CDH集群时需要做一些前置的准备,本次安装使用的环境已经做好前置准备,需要做的准备如下: 1.hosts以及hostname配置正确 2.服务器没有启用IPv6...7.选择存储库 CDH选择数据包的方式 ? ? 指定CM的自定义存储库 ? 8.JDK的安装 ? 9.输入主机密码 ? 10.集群安装需要的包 ? ? 11.检测CDH版本 ?

    98140

    CDH6.3应知应会

    CDH 简介 Cloudera Manager是一个拥有集群自动化安装、中心化管理、集群监控、报警功能的一个工具,使得安装集群从几天的时间缩短在几个小时内,运维人员从数十人降低到几人以内,极大的提高集群管理的效率...资源监控和运维:CDH内置了管理、监控、诊断、配置修改等工具,使集群的监控和运维变得更加简单高效。不再需要安装第三方软件,如ganglia和nagios,以进行监控和运维。...手动部署需要管理员逐个安装和配置各个组件,而 Cloudera Manager 则提供了集中式的集群部署、配置、监控和维护。 4. CDH 集群中如何进行故障排除和监控?...如果有,可以分享一下你在使用 CDH 部署和管理集群时的经验,如如何添加节点、配置服务、监控集群状态等。如果没有直接使用经验,可以提及自己对 CDH 的了解和学习计划。 6....CDH 集群如何实现高可用性?

    26010

    如何使用StreamSets实时采集Kafka中嵌套JSON数据并写入Hive表

    1.文档编写目的 ---- 在前面的文章Fayson介绍了关于StreamSets的一些文章《如何在CDH中安装和使用StreamSets》、《如何使用StreamSets从MySQL增量更新数据到Hive...并入库Kudu》和《如何使用StreamSets实时采集Kafka数据并写入Hive表》,本篇文章Fayson主要介绍如何使用StreamSets实时采集Kafka中嵌套的JSON数据并将采集的数据写入...配置Kafka相关信息,如Broker、ZK、Group、Topic及Kerberos信息 ? 配置数据格式化方式,写入Kafka的数据为JSON格式,所以这里选择JSON ?...5.总结 ---- 1.在使用StreamSets的Kafka Consumer模块接入Kafka嵌套的JSON数据后,无法直接将数据入库到Hive,需要将嵌套的JSON数据解析,这里可以使用Evaluator...模块,StreamSets支持多种语言的Evaluator(如:JavaScprit、Jython、Groovy、Expression及Spark)。

    5K51

    数栈V6.0全新产品矩阵发布,数据底座 EasyMR 焕新升级

    图片EasyMR 的集群管理包括以下五大功能:· 主机管理:可以对接x86服务器、ARM 服务器、Kubernetes 集群等主机类型,进行包括批量接入、主机下架、主机监控等在内的主机操作· 安装部署:...基于此,数栈支持 CDP/CDH 平滑迁移到 EasyMR 的解决方案,大大降低企业迁移成本低。生产业务不能停,该方案支持双轨运行,即客户的原 CDH 集群和信创的 EasyMR 集群可以同时运行。...包含集群的切换,及老服务器下线,新服务器上线等动作切换,最终达到 CDP/CDH 平滑迁移到 EasyMR 的目的,并且实现对客户侧的业务无感知。...图片EasyMR 的实践应用在介绍完 EasyMR 的具体功能和特性之后,下文将为大家介绍2个 EasyMR 的经典实践应用落地,更深地感受 EasyMR 是如何帮助企业更高效、平滑、安全地实现实现国外进口产品的国产化替代...图片面对客户需求,数栈 + EasyMR 与云平台的网络架构、服务器、云平台的统一权限管控等各项内容实现全面兼容适配,保证在客户开通权限资源后,依然能够保障 EasyMR 的稳定运行。

    38730

    0001-CDH网络要求(Lenovo参考架构)

    [01.jpg] 2.数据网络 数据网络是用于数据访问的节点之间的私有集群数据互连,比如在集群内的节点之间移动数据,或者将数据导入到CDH集群。CDH集群通常会连接到企业内部的数据网络。...需要2个TOR交换机:一个是用作带外管理,一个是用于CDH的数据网络。节点的带外管理至少需要一个1GbE交换机。数据网络的交换机一般为10GbE,具体取决于工作负载。...通过System x3650 M5服务器中的集成管理模块II(IMM2),带外管理可实现集群节点的硬件级管理,如节点部署,基本输入/输出系统(BIOS)配置,状态和电源状态。...G8272的过载率(over-subscription ratio)是1:2. 下图展示了当CDH集群安装在多个机架上时,如何配置网络。...6.CDH只支持IPv4,不支持IPv6 7.机架之间的网络连接速度应该足够快。 8.确保网络接口对于集群中的所有节点应该是一致的。

    1.8K140

    基于Ambari构建自己的大数据平台产品

    我们公司最初是使用CDH的环境,近日领导找到我让我基于Ambari做一个公司自己的数据平台产品。...大数据平台包含数据接入模块,数据存储模块,数据计算模块,资源调度模块,集群监控模块组成,致力于完成数据存储、流计算、批处理、交互式分析等多种需求。本文将重点介绍大数据平台建设规划。...集群资源监控使用自行开发的XJManager,页面应包含组件名称及状态统计信息,主机健康信息,用户管理等模块,实现用户通过Web页面就可以安装配置大数据平台。...数据接入模块   包含传感器数据采集程序接入,使用Flume采集业务系统日志数据,对接其他业务系统数据库数据。对实时采集的数据使用Kafka作为缓冲。...集群监控模块 实现ambari页面汉化 修改ambari监控页面样式 实现ambari一键安装部署   目前初期建设待解决的问题如下: 3.1.

    1.5K30

    如何为Kerberos环境的CDH集群在线扩容数据节点

    在集群资源紧张的情况下可通过动态的扩容节点来增加集群的计算能力,前面Fayson的文章讲过《如何在非Kerberos环境下对CDH进行扩容》、《如何使用Cloudera Manager在线为集群减容》。...本篇文章主要介绍如何为Kerberos环境的CDH集群在线扩容数据节点。Kerberos和非Kerberos的集群减容步骤是一样的,Fayson不会专门用文章来介绍。...1.CDH集群已安装成功并正常运行 2.集群已启用Kerberos 2.扩容集群环境说明 ---- 1.扩容前集群节点信息 [pur3mbddcm.jpeg] 2.扩容前HDSF容量 [72j9otl41t.jpeg...关于Kerberos客户安装可参考Fayson前面的文章《如何给Kerberos环境下的CDH集群添加Gateway节点》和《如何在CDH集群启用Kerberos》。...节点无fayson用户导致,在执行MR作业时报错“User fayson not found” 解决方法:将集群节点上创建的用户信息同步至新DataNode节点的OS中。

    2.6K91

    如何给Hadoop集群划分角色

    网络要求(Lenovo参考架构)》,《如何为Hadoop集群选择正确的硬件》和《CDH安装前置准备》,而我们在搭建Hadoop集群时,还一件很重要的事就是如何给集群分配角色。...当你使用Cloudera Manager的安装向导来安装CDH时,CM会根据主机的可用资源,自动的分配角色到各台主机,边缘节点除外。...MySQL主备参考《如何实现CDH元数据库MySQL的主备》,《如何实现CDH元数据库MySQL的主主互备》和《如何实现CDH元数据库MySQL的高可用》 OpenLDAP主备参考《3.如何实现OpenLDAP...CDH元数据库MySQL的主备》,《如何实现CDH元数据库MySQL的主主互备》和《如何实现CDH元数据库MySQL的高可用》 OpenLDAP主备参考《3.如何实现OpenLDAP的主主同步》 Kerberos...CDH元数据库MySQL的主备》,《如何实现CDH元数据库MySQL的主主互备》和《如何实现CDH元数据库MySQL的高可用》 OpenLDAP主备参考《3.如何实现OpenLDAP的主主同步》 Kerberos

    1.4K70

    0868-7.1.5-如何配置及使用Cloudera Replication Manager

    ,本文主要介绍如何配置及使用RM进行HDFS和Hive 复制 测试环境 源集群版本:CDH5.16.2、CM 5.16.2、已启用Kerberos 目标集群版本:CDH7.1.5、CM7.2.4、已启用...源集群和目标集群节点之间必须网络互通 2. 源集群和目标集群都有企业版 License 3....3.RM配置 1、在目标CDP7.1.5 集群CM界面>备份>同行中 2、点击添加同行,填写源CDH5.16.2集群的地址和CM页面的管理员用户和密码 如测试连接中出现如下异常,表明两个集群的Kerberos...使用源集群也就是CDH5集群的凭证在CDP7集群中认证,然后执行HDFS命令查看 如CDP.COM 为CDP7.1.5 集群的Kerberos域,FAYSON.COM为CDH5.16.2集群的域 #需确认在.../user/hive/warehouse,这也是官网建议的做法,这样原有 C5 应用代码可以做到无感知运行。

    1.5K20

    大数据物流项目中CM的安装与运用

    3)、测试时,需要什么服务,启动什么服务,不要全部启动(耗内存,耗性能,没有任何意义) 架构原理:CM如何安装CDH框架,原理架构是什么?????...1)、CM安装CDH集群时,架构属于主从分布式架构(Master/Slaves) 主节点(老大):CMS(ClouderaManagerServer),在一台机器上运行 从节点(小弟):安装服务...(Cloudera Agent),所有大数据集群机器 此时大数据集群机器,被CM管理,监控到基本信息(磁盘IO、网络IO和CPU与内存使用等等) 2)、Cloudera 将所有大数据框架放在某个目录...,打成包:parcel 首先parcel包,存储在CMServer主机的目录:/opt/cloudera/parcel-repo 3)、CMServer服务,将parcel包,分发给所有大数据集群机器...大数据服务器之CDH框架安装细节 当使用CM安装CDH集群以后,可以通过CM界面UI,管理整个集群服务和查看监控运行状态。

    43430
    领券