旨在为的CDN有需求的用户提供一个安装简单,使用方便易操作的一套系统及解决方案,可帮助大中小企业或站长低成本,部署快速,构建自己的CDN网络或服务器群,提供专业的CDN加速服务或增值服务,更好的在线服务 使用wdCDN,自架CDN加速系统,部署架构CDN系统,提供CDN加速服务,CDN加速解决方案,将变得容易和简单 wdCDN2 新版本不再依懒wdCP,而是一个独立的服务和应用,可以单独安装和使用 单节点版本功能相对简单 ,只实现基础功能,如网站管理,缓存内容管理,系统资源监控 对于针对站点的流量统计或计费等,可以考虑使用多节点版本 安装 支持系统:CentOS 6.x/7.x,RedHat及其它未测试,也欢迎测试! 注意:wdcdn2单节点版本仍然是免费的,但服务和技术支持则需收费 1、安装wdcdn2 wget http://dl.wdlinux.cn/files/wdcdn/wdcdn2_install.sh
它也指由麻省理工实现此协议,并发布的一套免费软件。它的设计主要针对客户-服务器模型,并提供了一系列交互认证——用户和服务器都能验证对方的身份。Kerberos协议可以保护网络实体免受窃听和重复攻击。 环境说明: CDH版本:5.11.2 Linux版本:Centos 7 Docker版本:Docker version 18.06.0-ce JDK版本:1.8 操作用户:root 机器部署: IP Kerberos client 4 192.168.101.235 cdh-node-3 N/A Kerberos client 各节点之间可以通过ssh免密码登录 Kerberos Kerberos 安装 cdh-node-1作为Kerberos主节点安装服务: yum install krb5-libs krb5-server krb5-workstation 通过命令查看安装列表 在cm节点安装ldap客户端 yum install openldap-clients 5.
提供包括云服务器,云数据库在内的90+款云计算产品。打造一站式的云产品试用服务,助力开发者和企业零门槛上云。
当然是有原因,随着不断的学习了解,慢慢意识到之前做法存在很多缺陷,最终对比了比较成熟的解决方案EMR和CDH,最终选择了使用CDH来搭建大数据管理平台,那么我们就开始新的一趴,企业级大数据管理平台CDH 是由cloudera进行开发的大数据一站式平台管理解决方案,基于Hadoop生态的第三方发行版本,这样的描述相信大家还是挺难理解的,我们一起来梳理下CDH带来的改观. 经常会浪费大量的时间去编译组件,解决版本冲突问题。 CDH每个版本都会有兼容认证都是经过严格的测试之后公布的,理论上来说只要统一CDH版本就不会出现兼容问题 稳定安全 不同的版本会有不同的漏洞很容易被被利用,又不敢轻易更新 版本更新快。 --state 关闭selinux: vim /etc/selinux/config 找到SELINUX改为: SELINUX=disabled 所有节点ssh免密码登录 先在cm 上执行: ssh-keygen
NetworkManager search localdomain nameserver 192.168.232.2 nameserver 8.8.8.8 网关IP和DNS地址一样 8.8.8.8 是Google提供的免费 如果安装不成功,可能是Java版本不合适或者Java环境变量没配成功 推荐官方版本:oracle-j2sdk1.8-1.8.0+update181-1.x86_64.rpm cd /opt/cloudera-manager 安装完server之后,主节点的cdh安装算完成了,那么安装目录都在哪里呢? 八、安装CDH服务 1、登录cdh安装界面 (1)浏览器访问 http://cdh01:7180,进入cdh登录界面,默认账户密码 admin admin ? ? ? 选择第一个免费版本 ? 出现了一个节点安装失败,点击重试了很多下都没反应,最后等其他节点安装完很久后 重试可以再次安装了,可能是网络原因,看日志发现下载依赖包时换了很多个mirror 安装agent有时候还要拼人品拼网速,有时候很快安装完了
) #查看jdk版本 [root@hdp-03 ~]# rpm -qa|grep java tzdata-java-2012j-1.el6.noarch java-1.7.0-openjdk-1.7.0.9 -2.3.4.1.el6_3.x86_64 java-1.6.0-openjdk-1.6.0.0-1.50.1.11.5.el6_3.x86_64 #按版本卸载jdk [root@hdp-03 ~]# 我试安装时,这点遗漏了,导致安装CDH的时候一直刷不出5.9版本,通过日志发现,没有manifest.json就会去下载,不能访问外网就报错了,但不影响安装CDH,还是mv一下吧。 第三部分:CDH--图像化界面安装 ? 2)然后勾选继续 ? 3)按需求所选,我这里选择免费,继续。 ? 4)继续 ? 7)然后选择版本 ? 8)然后进入安装环节: ? 激活主节点卡住 解决方案: 我是把hosts文件中第一行中的主机名称去掉就好了!!!!! #127.0.0.1这一行不能有其他东西!
/bin/bash cat host | while read host do { scp -r 1 host: }&wait done 6.jdk 安装 ①都卸载自带jdk(三台都需要,版本可能不一样根据实际操作 我试安装时,这点遗漏了,导致安装CDH的时候一直刷不出5.9版本,通过日志发现,没有manifest.json就会去下载,不能访问外网就报错了,但不影响安装CDH,还是mv一下吧。 3)按需求所选,我这里选择免费,继续。 ? 4)继续 ? 5)因为我们在节点上启动了agent,所以直接点“当前管理的主机”,此时当前管理主机有5个。 7)然后选择版本 ? 8)然后进入安装环节: ? 激活主节点卡住 解决方案: 我是把hosts文件中第一行中的主机名称去掉就好了!!!!! #127.0.0.1这一行不能有其他东西! 年少风
“Apache Hadoop存在版本管理混乱、部署过程繁琐、升级过程复杂、兼容性差、安全性低等问题,CDH是Hadoop商业发行版之一,本文介绍基于Cloudera Manager的Cloudera Hadoop 6.1.0大数据平台搭建,简单易上手 ” 基础环境准备 1、CM和CDH包 准备cm的rpm包,cdh的parcel包,第1个链接内的需要完全下载,第2个链接内根据linux版本(centos6 root@127.0.0.1 4、时钟同步 时钟同步(保证其他节点同cm节点时钟一致): 1、所有机器安装ntp :yum -y install ntp 2、CM节点配置时钟与自己同步:vim /etc 使用本地parcel包安装cdh(坑很多),cm的安装,web访问192.168.242.134:7180登录cm页面按照指引进行cdh安装。 2、配置cdh中的大数据相关组件 按照指引进行,记住数据库的登录名和密码; ? 初始化组件安装时容易出现主机资源不足,前期应该给cm节点足够的存储空间; ?
一、前述 CDH(Cloudera's Distribution, including Apache Hadoop)是Hadoop众多分支中的一种,由Cloudera维护,基于稳定版本的Apache Hadoop 前期准备: 操作系统:CentOS 6 JDK版本:1.7.0_80 所需安装包及版本说明: CDH-5.4.0-1.cdh5.4.0.p0.27-el6.parcel CDH-5.4.0-1.cdh5.4.0 本地源 下载好文件CDH-5.4.0-1.cdh5.4.0.p0.27-el6.parcel以及manifest.json,将这两个文件放到server节点的/opt/cloudera/parcel-repo 三、使用 免费版本的CM5已经去除50个节点数量的限制。 ? 各个Agent节点正常启动后,可以在当前管理的主机列表中看到对应的节点。 ? 选择要安装的节点,点继续。 ? CDH部署步骤: 1、启动CM Server、 Agent 2、选择节点 3、选择本地Parcel 4、服务器检查 5、选择服务 6、服务配置 7、数据库设置 8、集群设置 9、安装完成 CDH建库脚本
2、选择自定义安装,点击下一步。 ? 3、这里不用修改,是VMware的版本和一些限制说明,点击下一步。 ? 4、这里先选择稍后安装操作系统,点击下一步。 ? 5、选择系统为Linux,版本为Centos7 64位,点击下一步。 ? 6、修改虚拟机名称,位置,点击下一步。 ? 7、CPU默认为1核,点击下一步。 ? 8、内存设置为4GB,点击下一步。 ,基于稳定版本的Apache Hadoop构建,并集成了很多补丁,可直接用于生产环境。 CM 6.3.1,CDH 6.3.2 (6.3.3版本及以上的要收费了) 组件版本支持情况 https://docs.cloudera.com/documentation/enterprise/6/release-notes 那么CDH管理工具已经安装完成,下面我们使用CDH安装Hadoop集群环境。 四、安装部署HADOOP大数据集群 开始安装 ? 同意条款 ? 选择安装版本,可以选择试用或者免费版 ?
CDH是Cloudera Distribution Hadoop的简称,顾名思义,就是cloudera公司发布的Hadoop版本,封装了Apache Hadoop,提供Hadoop所有的服务,包括HDFS 一、准备工作 环境 JDK:1.8 centos:7.3 操作系统:CentOS 6 JDK 版本:1.7.0_80 所需安装包及版本说明:由于我们的操作系统为CentOS7,需要下载以下文件: 四、CDH5 安装 CM Manager && Agent 成功启动后,登录前端页面进行 CDH 安装配置。 ? ? ? 免费版本的 CM5 已经去除 50 个节点数量的限制。 ? 点击,继续,如果配置本地 Parcel 包无误,那么下图中的已下载,应该是瞬间就完成了,然后就是耐心等待分配过程就行了,大约 10 多分钟吧,取决于内网网速。 点击,继续,如果配置本地Parcel包无误,那么下图中的已下载,应该是瞬间就完成了,然后就是耐心等待分配过程就行了,大约10多分钟吧,取决于内网网速。 ? ?
CDH是Cloudera Distribution Hadoop的简称,顾名思义,就是cloudera公司发布的Hadoop版本,封装了Apache Hadoop,提供Hadoop所有的服务,包括HDFS 一、准备工作 环境 JDK:1.8 centos:7.3 操作系统:CentOS 6 JDK 版本:1.7.0_80 所需安装包及版本说明:由于我们的操作系统为CentOS7,需要下载以下文件: [1.png] [2.png] [3.png] 免费版本的 CM5 已经去除 50 个节点数量的限制。 [4.png] 各个 Agent 节点正常启动后,可以在当前管理的主机列表中看到对应的节点。 [6.png] 点击,继续,如果配置本地 Parcel 包无误,那么下图中的已下载,应该是瞬间就完成了,然后就是耐心等待分配过程就行了,大约 10 多分钟吧,取决于内网网速。 ,大约10多分钟吧,取决于内网网速。
2020年2月4日Cloudera宣布正式发布CDH6.3.3,该维护版本(maintenance release)包含以前CDH6.3次要版本(minor release)的所有功能,并添加了许多重要的 所有的Cloudera Manager安装包,CDH Parcel和CDH的安装包的存储仓库现在都需要使用有效的凭证进行身份验证,才能访问CDH6.3.3或更高版本。 关于免费版的重要说明 从CDH6.3.3开始,将不再提供免费版(Cloudera Express)。 如果你现在使用的是CDH免费版,将不支持升级到Cloudera Manager6.3.3或CDH6.3.3及更高版本。 如果你使用的是CDH或CDP Data Center的60天试用版本,如果你需要升级到6.3.3或更高版本,也需要具备有效的许可证。
github: https://github.com/fayson/cdhproject 提示:代码块部分可以左右滑动查看噢 1 文档编写目的 受前段时间Oracle官宣的从2019年1月之后将不再提供免费的的 JDK商业版本的影响,Cloudera开始开发基于OpenJDK的Hadoop平台,参考Fayson之前的文章《Java收费,Hadoop怎么办?》。 内容概述 1.CDH各版本的JDK支持说明 2.迁移JDK 3.检查JDK的使用版本 4.组件功能校验 5.总结 测试环境 1.CM和CDH版本为5.16.1 2.采用root用户操作 3.Redhat7.4 2 CDH各版本的JDK支持说明 Cloudera Manager和CDH需要所有节点都安装了受支持的Java Development Kit (JDK) ,具体受支持的版本如下: Cloudera 可以注意到Fayson集群的的5个节点既安装了Oracle JDK1.7也安装了1.8。 2.我们在Cloudera Manager的页面上确认集群目前在使用的JDK版本。
由于Hadoop版本混乱多变,因此,Hadoop的版本选择问题一直令很多初级用户苦恼。 (2)RAID在保证数据可靠的前提下,通过引入校验码较少数据块数目。 2.Cloudera HadoopCDH版本衍化 Apache当前的版本管理是比较混乱的,各种版本层出不穷,让很多初学者不知所措,相比之下,Cloudera公司的Hadoop版本管理的要很多。 我们知道,Hadoop遵从Apache开源协议,用户可以免费地任意使用和修改Hadoop,也正因此,市面上出现了很多Hadoop版本,其中比较出名的一是Cloudera公司的发行版,我们将该版本称为CDH 当我们决定是否采用某个软件用于开源环境时,通常需要考虑以下几个因素: (1)是否为开源软件,即是否免费。 (2)是否有稳定版,这个一般软件官方网站会给出说明。
第一章 是什么 背景 在学习CDH之前,我们首先可以考虑如下问题: 1000台服务器的集群,最少要花费多长时间来搭建好Hadoop集群? 对于以上集群进行hadoop版本升级,你会选择什么升级方案,最少要花费多长时间? 新版本的Hadoop,与Hive、Hbase、Flume、Kafka、Spark等兼容问题如何解决? 介绍 Cloudera’s Distribution Including Apache Hadoop: 简称“CDH”, 是Hadoop众多分支中的一种,由Cloudera维护,基于稳定版本的Apache 本地源 #(node01) ## 将上传好的文件 CDH-5.4.0-1.cdh5.4.0.p0.27-el6.parcel 以及 manifest.json,将放到server节点的/opt/cloudera 运行Oozie脚本 hdfs上传脚本文件 Oozie cli 运行脚本 ? 点击WebUI 页面, 查看脚本任务执行详情 ? 查看执行的节点以及执行的详细信息 ?
CDH6是基于Hadoop3同时包含大量其他组件的大版本更新的发布版本,许多用户考虑到未来CDH的版本主要是基于C6,而CDH5会慢慢的停止更新,所以考虑新搭集群使用CDH6,或者想把已有的CDH5集群升级到 参考: 《0491-如何在Redhat7.4安装CDH6.1》 7.2 Cloudera免费版节点数限制 Cloudera免费版现在不允许集群节点数超过100,具体如下描述: 1.单个Cloudera 注意:如果你从Cloudera企业版降级为Cloudera免费版后,并且你的主机数量超过了100,这时Cloudera Manager会禁用集群管理的所有功能除了停止集群。 另外,无论是国外还是国内支持案例也多,国内可以找到很多相关的实施案例供参考,可以节省运维人力、物力成本。 建议: 1.如果你是新搭集群,并且规模不太大(50个节点以内),基于Hadoop的应用也都是新开发,CDH6是一个不错的选择,毕竟避免了以后还要考虑从CDH5升级到CDH6的麻烦,同时还需要进行一次应用测试和迁移
基础环境 1.1.节点规模 测试环境,最小规模,最少4台服务器。 如果是生产环境,最少6台,3台管理节点包括1个Cloudera Manager,2个NameNode做高可用,3个工作节点。 常见的较小规模的生产系统一般为10-20台。 1.2.操作系统 CDH支持大部分主流的64位操作系统,我这里会以centos 6.9部署CDH 5.14版本为例子。 其他CDH版本及其对应的操作系统版本可参考:[CDH版本及其支持的操作系统版本](https://www.cloudera.com/documentation/enterprise/release-notes 如果是使用云上的虚拟机,最好确认下网卡的多队列支持,笔者就被XX云网卡多队列支持数过少而坑过,导致集群性能利用率上不去,且CPU负载偏移,网络丢包等现象。
比如CDH 6.1.0版本发布时Apache Kafka已经演进到了 2.1.0 版本,但CDH中的Kafka依然是 2.0.0 版本,显然那些在Kafka 2.1.0 中修复的Bug只能等到CDH下次版本更新时才有可能被真正修复 Confluent Kafka Confluent Kafka目前分为免费版和企业版两种。 前者和Apache Kafka非常相像,除了常规的组件之外,免费版还包含 Schema注册中心和REST proxy两大功能。 除此之外,免费版包含了更多的连接器,都是Confluent公司开发并认证过的,可以免费使用。至于企业版,则提供更多功能。最有用的当属跨数据中心备份和集群监控两大功能了。 多个数据中心之间数据的同步以及对集群的监控历来是Kafka的痛点,Confluent Kafka企业版提供了强大的解决方案。
特点比较 Apache Kafka 依然是开发人数最多、版本迭代速度最快的Kafka 在2018年度Apache基金会邮件列表开发者数量最多的Top 5排行榜中,Kafka社区邮件组排名第二位。 如果仅仅需要一个消息引擎系统亦或是简单的流处理应用场景,同时需要对系统有较大把控度,那么推荐使用Apache Kafka Confluent Kafka Confluent Kafka目前分为免费版和企业版 免费版包含了更多的连接器,它们都是Confluent公司开发并认证过的,你可以免费使用它们 至于企业版,它提供的功能就更多了 最有用的当属跨数据中心备份和集群监控两大功能了。 比如CDH 6.1.0版本发布时Apache Kafka已经演进到了2.1.0版本,但CDH中的Kafka依然是2.0.0版本,显然那些在Kafka 2.1.0中修复的Bug只能等到CDH下次版本更新时才有可能被真正修复 CDH/HDP Kafka,大数据云公司提供的Kafka,内嵌Apache Kafka 优势在于操作简单,节省运维成本 缺陷在于把控度低,演进速度较慢。 参考 Apache Kafka实战
商业发行版主要是提供了更为专业的技术支持,这对于大型企业更为重要,不同发行版都有自己的一些特点,本文就各发行版做简单对比介绍。 DKhadoop将复杂的大数据集群配置简化至三种节点(主节点、管理节点、计算节点),极大的简化了集群的管理运维,增强了集群的高可用性、高可维护性、高稳定性。 01.png l 2、cloudera发行版:CDH是Cloudera的hadoop发行版,完全开源,比Apache hadoop在兼容性,安全性,稳定性上有增强。 02.png 3、hortonworks发行版:Hortonworks 的主打产品是Hortonworks Data Platform (HDP),也同样是100%开源的产品,其版本特点:HDP包括稳定版本的 03.png 4、MAPR发行版:mapR有免费和商业两个版本,免费版本在功能上有所减少。
云端获取和启用云服务器,并实时扩展或缩减云计算资源。云服务器 支持按实际使用的资源计费,可以为您节约计算成本。 腾讯云服务器(CVM)为您提供安全可靠的弹性云计算服务。只需几分钟,您就可以在云端获取和启用云服务器,并实时扩展或缩减云计算资源。云服务器 支持按实际使用的资源计费,可以为您节约计算成本。
扫码关注云+社区
领取腾讯云代金券