集群是弹性 MapReduce( EMR )提供托管 服务的基本单元,也是用户使用和管理 EMR 服务的主要对象。本文为您介绍通过腾讯云官网控制台,快速创建 EMR 集群。 方式二:直接登录控制台,选择产品弹性MapReduce,单击【新建】进入创建购买页。 二、创建流程: 在腾讯云官网自助购买页面中,仅支持依赖于云服务器(CVM)的 EMR 集群创建。 3、集群网络 为保证 EMR 集群的安全性,我们将集群各节点放入了一个私有网络中,您需要设置一个私有网络以保证 EMR 集群的正确创建。 EMR 密码分两个密码:"机器登录密码" 和 "EMR-UI快捷入口密码" 机器登录密码:如果不使用密钥登录,EMR集群中的机器节点,将采用密码方式登录。 反之将需要密钥登录机器,密码对机器的登录将失效。 EMR-UI快捷入口密码:EMR提供了集群UI快捷入口,帮助用户查看集群各种状态。快捷入口将采用该密码进行合法验证。
EMR的某些客户的数据仓库使用EMR-Hive存储,presto连接hive快速ad-hoc查询,但是有些场景下不同的业务部门有各自不同的使用presto查询需求,多EMR-Presto集群共享EMR-Hive 集群配置方案可以满足这种需求。 image.png 假设EMR-Hive的集群为A集群,新增的EMR-Presto集群为B+集群,设置A集群为B+共享集群,只需要把B+集群的presto-hive配置变更即可。 具体操作方案如下: 1.拷贝A集群hdfs-site.xml,core-site.xml到B集群hadoop用户权限目录下,这里以/home/hadoop为例子, #cp hdfs-site.xml / 5.在emr控制台重启presto集群,包括coordinator和worker节点。
个人网站、项目部署、开发环境、游戏服务器、图床、渲染训练等免费搭建教程,多款云服务器20元起。
一、集群搭建的准备工作 ---- 1:首先拥有腾讯云账号 2:确定需求、确定地域、私有网络(需要和EMR的地域同步)、安全组 确定地域:EMR集群搭建的地理位置,由于集群是通过公网访问,一般建议选择接近企业所在位置 3、其他配置 image.png image.png 1、所属项目 该集群所在的项目 2、集群名称 用于区分集群,创建后可以修改 3、远程登录 开启后,可以选择使用xshell等远程工具登录。 EMR 密码分两个密码:"机器登录密码" 和 "EMR-UI快捷入口密码" 机器登录密码:如果不使用密钥登录,EMR集群中的机器节点,将采用密码方式登录。 反之将需要密钥登录机器,密码对机器的登录将失效。 EMR-UI快捷入口密码:EMR提供了集群UI快捷入口,帮助用户查看集群各种状态。快捷入口将采用该密码进行合法验证。 四、集群销毁 ---- 操作步骤 登录 EMR控制台,在左侧栏选择【集群列表】。 在实例列表的【管理】列,选择【更多】>【销毁】进入销毁页,勾选已阅读同意销毁说明,点击下一步。
前言:上一篇我们了解了EMR集群的搭建,也了解到了集群节点的基本规格和硬件配置,那么本篇我们将学习一些集群的一些常用操作,比如集群的扩容、缩容以及COS对象存储的开启等一些注意事项。 一、集群的扩容、缩容操作 当您的集群资源(计算资源、存储资源)不足的时候,您可以将您的集群进行水平扩展。通过上一篇文章我们了解到,目前支持扩展您的 Core 节点和Task节点。 登录【控制台】,在【云产品】中选择【弹性MapReduce】,然后从左侧菜单中进入【运硬件管理】,如图: 图片.png 扩容 图片.png 扩容节点类型只支持Core节点、Task节点 按量计费集群 选择扩容节点的数量后,单击【确定】,并成功支付后,集群会开始扩容操作,扩容操作一般需要10-20分钟,请耐心等待。 图片.png 开启对象存储COS 如果您在创建集群的时候没有开启对象存储COS,那么可以通过以下步骤开通: 登录【控制台】,在【云产品】中选择【弹性MapReduce】,然后从左侧菜单中进入【集群列表】
在上一章我们学习了EMR集群的监控和报警功能,其实EMR集群还有很多功能会经常用到,我带着大家一起去了解一些其他的常用操作吧! 导出软件配置 通过 EMR 控制台,可以导出存量集群的软件配置参数,后续在新建集群时可使用这些参数进行 软件配置,从而快速新建一个熟悉的集群。 1、在控制台找到自己的emr集群,点击【更多】,接着点击【导出软件配置】。 image.png 2、点击之后的界面如下图。 详情页 在控制台,找到自己的集群,点击【实例id】或者【详细】都可以进去集群的详情页面。 image.png 集群的详细页分为三类: 实例详情: 主要包括本集群的实例ID,公网ip,集群的部署地域,所属项目组,EMR的软件信息等 image.png 集群事件: 服务警告: image.png
前面四节已经向大家介绍完,EMR集群的概括和搭建以及集群内的一些操作,在实际的生产过程中,又会出现各式各样的故障。接着就为大家介绍一些常见的故障已经解决方法。 hdfs haadmin -getServiceState 节点名 切换namenode状态:hdfs haadmin -failover nn2 nn1 异常出现情况: 进入安全模式,整个集群是只读状态 如何判断一个集群进入了安全模式??? 使用Hadoop用户执行命令:hdfs dfsadmin -safemode get 如何重启NameNode节点? 如果是非HA集群,必须重置,而且处于安全模式的时候集群不能使用。 HDFS排障---------DataNode异常讲解 DataNode主要提供真实文件数据的存储服务。 先挂盘,在格式化,创建对象的目录,如果家的是/data盘,logs目录,将目录的owner改为hadoop用户 数据块丢失:EMR集群中的组件都是属于hadoop用户的,处理zookeeper。
集群搭建成功之后,为了方便自我监控。集群自带有监控和告警。一起来看看吧! 监控系统 ---- 监控入口 登录【控制台】,选择【弹性MapReduce】进入左侧的【集群监控】,可以看到监控分为服务监控与主机监控 想看集群监控时,一定要选择属于自己集群的所在地区和集群名称。 image.png 告警系统 ---- 告警入口 登录【控制台】,通过点击【云产品】找到【云监控】进入:打开之后如下图界面 image.png 告警的概述 在某些产品状态改变时,可以创建告警来及时通知您采取措施 告警包含以下几个组成部分: 告警触发条件(什么条件下发送告警) 告警对象(哪个对象发出告警) 告警接收组(谁接到告警) 告警接收方式(怎么接收告警) 创建告警策略 登录
导语 EMR用户常常会将使用不同资源管理系统的组件混合部署在同一个集群,这样会出现资源竞争的情况。若各组件资源超额配置,可能有机器宕机的风险。 本文将从案例分析来聊聊混部集群资源配置需要注意的事项 背景 EMR用户反馈多台机器发生了重启,影响集群使用,需要查明原因 定位分析及原因 1、从宕机机器选了一台,在EMR控制台查看该节点资源监控,可以看出机器宕机的直接原因是内存被打爆 扩展 EMR集群常用的计算组件比如hive,spark,flink可以使用yarn作为其资源管理系统,但假如集群部署了hbase,impala,presto,storm等组件,就有必要考虑集群资源使用分配的问题
一、集群监控 监控入口 登录【控制台】,选择【弹性MapReduce】进入左侧的【集群监控】,可以看到监控分为服务监控与主机监控 如下图可以看到服务监控主要是一些集群组件的监控: 图片.png 下面的主机监控主要是 CPU、内存、文件句柄、磁盘、网络、进程等指标的监控: 图片.png 二、告警策略 所谓告警策略,就是当你的集群发生异常时,你对集群进行了监控,也就是制定了策略,那么发生异常的这个事件将会告知给你选择的接收人
高可靠性: WAL机制,保证数据写入的时候不会因为集群异常而导致写入数据丢失 Replication机制,保证了在集群出现严重的问题时候,数据不会发生丢失或者损坏 Hbase底层使用HDFS,本身也有备份 HBase集群常见故障 1、重启regionserver没反应,rs已经假死。 解决办法:修复hbase集群存在region不一致的问题,然后指令初始化重新下发。
为了快速验证参数调整是否符合预期,我们可以通过压测集群的方法,模拟上层业务对集群的访问,从而加快验证参数调整是否符合预期。 HBase 参数调优 在EMR实例中的HBase集群默认参数,并没有调为最优。我们强烈推荐用户在使用前,根据自己使用场景,调整参数。 2.1 准备压测HBase集群 根据您业务需求,购买合适规格的EMR实例,并选择HBase组件。我们推荐使用高IO机型,配本地磁盘。 2.2 压测工具 1) YCSB官网下载可执行程序包,选择0.13.0版本; 2) 解压可执行程序包,假设解压后目录名称为ycsb-0.13.0 3) 复制腾讯云EMR实例中的HBase集群配置到ycsb EMR实例的HBase集群配置在master节点的/usr/local/server/hbase/conf 3. 压测与结果分析 压测过程重要分两步,加载数据阶段,和压测阶段。
二、EMR系统架构 ---- 弹性 MapReduce 的软件完全源于开源社区中的 Hadoop 软件,您可以将现有的大数据集群无缝平滑迁移至腾讯云上。 腾讯云品质的安全加固服务为 EMR 集群提供一体化的安全服务,涵盖网络防护、入侵检测、漏洞防护等。 易用 可以响应业务需求创建不同版本的集群分析 COS 上的同一份数据。 节约成本 通过 EMR 服务,可以按业务曲线随心伸缩托管 Hadoop 集群,缩减高昂的硬件成本。 五、EMR集群产品功能 ---- 弹性伸缩 分钟级集群创建:通过控制台数分钟就可创建一个安全、稳定的云端托管 Hadoop 集群。 分钟级集群扩缩容:仅需数分钟即可对现有 EMR 集群进行平滑扩缩容,以适应互联网业务需求的快速变化。 API 支持:支持通过 API 方式便捷的在程序中创建、扩缩容、销毁 EMR 集群。
在开发中的开源项目JeePlatform:https://github.com/u014427391/jeeplatform 欢迎start(s收藏),打算集成单点登录到自己的开源项目里,所以先搭建环境 【集群简介】 使用nginx作为负载均衡,使用redis存储tomcat session,来实现集群中tomcat session的共享,使用redis作为cas ticket的仓库,来实现集群中cas /nginx -t 【Tomcat集群】 tar -xzvf apache-tomcat-7.0.82.tar.gz cp -r apache-tomcat-7.0.82 tomcat2 mv apache-tomcat 访问Tomcat1:http://ip1:8080/www/index.jsp 访问Tomcat2:http://ip2:8081/www/index.jsp 访问nginx代理的tomcat集群 maxInactiveInterval="60" /> 刷新页面发现,tomcat1和tomcat2的页面会切换,但是sessionID的不变的,说明Session共享实现了 参考教程: 单点登录集群
一、EMR简介 ---- Elastic MapReduce(EMR)是腾讯云提供的云上 Hadoop 托管服务,提供了便捷的 Hadoop 集群部署、软件安装、配置修改、监控告警、弹性伸缩等功能,EMR 如下图所示为EMR系统架构图: EMR架构图.jpg 二、EMR产品优势 ---- 1、灵活 与传统的本地化部署的Hadoop集群对比,EMR只需几分钟即可获得一个安全可靠的 Hadoop 集群,以运行 腾讯云品质的安全加固服务为 EMR 集群提供一体化的安全服务,涵盖网络防护、入侵检测、漏洞防护等。 4、易用 可以响应业务需求创建不同版本的集群分析 COS 上的同一份数据。 5、节约成本 通过 EMR 服务,可以按业务曲线随心伸缩托管 Hadoop 集群,缩减高昂的硬件成本。 各类型节点作用,如下图: EMR各节点作用.png Master 节点为管理节点,保证集群的调度正常进行。
zeppelin-daemon.sh start 这个时候你就能访问8080端口来访问zeppelin服务了 1503628382_39_w1892_h425.png 接入spark on yarn集群 下面就可以利用zeppelin在线调用我的spark on yarn集群了 下面利用python脚本生成需要处理的数据: 1503632390_19_w474_h138.png 该脚本随机生成了10亿个
EMR扩容 当 EMR 集群计算资源、存储资源不足时,可以通过控制台对 Core 节点和 Task 节点进行扩容。 EMR产品文档中说明,当集群的存储资源不足时,可通过控制台对Core节点(Core为存储数据及计算的节点,Task为纯计算节点,不存储数据)进行扩容。 扩容背景 某客户基于以上EMR产品文档中的扩容场景无法满足其需求时(仅扩容存储资源),寻求扩容数据盘相关帮助,这也是EMR客户比较常见的一种场景,例如前期未规划好集群规模不能满足数据持续增长带来的存储资源需求或先购买较低规模集群后随需求进行扩容等 通常来说为了保证EMR集群的统一稳定、便于管理,集群中同类型的节点都是保持一致的规格。存储资源亦是如此,如果仅对单台机器进行扩容数据盘则可能会导致数据不均衡,所以建议的是通过扩容新的节点来增添资源。 首先登录准备扩容的机器节点、确认要扩容的设备例如:/dev/vdb以及硬盘是否分区及挂载方式 可以通过命令lsblk或者parted /dev/vdb来查看 [jnycmbv3y.png] 这里的TYPE
ESS(EMR Remote Shuffle Service)是EMR在优化计算引擎的Shuffle操作上,推出的扩展组件。 EMR推出的基于Shuffle的ESS服务,可以优化目前方案的问题。优势如下: 使用Push-Style Shuffle代替Pull-Style,减少Mapper的内存压力。 支持计算与存储分离架构,可以部署Shuffle Service至特殊硬件环境中,与计算集群分离。 解决Spark on Kubernetes时对本地磁盘的依赖。 ESS架构图 ?
为响应公司业务上云,通过腾讯云上EMR搭建hbase集群。hive集群是在IDC机房,和普通集群迁移相比,这涉及到跨机房、跨集群的数据迁移,以及hive表数据到hbase集群数据的转换。 二、技术方案步骤 1、IDC机房与EMR网络的联通性验证 2、在EMR上搭建hbase集群及hive组件 3、迁移hdfs数据,数据校验 4、在目标集群创建对应hive库、表 5、在目标集群中将数据转换为 三、具体实施 1、IDC机房与EMR网络的联通性验证 需要自建集群和EMR各个节点网络互通。 2、在EMR上搭建hbase集群,hive组件(略) 3、迁移数据,数据校验 i)迁移数据 一般在新集群上运行同步,这样同步的作业可以在新集群上运行,对老集群影响较小。 通过编排脚本节点任务,将数据工厂hive集群迁至EMR的hbase集群过程自动化调度 在接口机安装EMR上一样的hadoop,hbase集群环境,然后调整脚本中的hadoop,hbase命令为该环境下的
Hadoop集群包含1个主节点和3个从节点,需要实现各节点之间的免密码登录,下面介绍具体的实现方法。 一、Hadoop集群环境 二、免密登录原理 每台主机authorized_keys文件里面包含的主机(ssh密钥),该主机都能无密码登录,所以只要每台主机的authorized_keys文件里面都放入其他主机 (需要无密码登录的主机)的ssh密钥就行了。 #登录hadoop03主机,将ssh密钥加入authorized_keys文件中 [root@hadoop03 .ssh]# cat id_rsa.pub >> authorized_keys [root 验证免密登录 使用ssh 用户名@节点名或ssh ip地址命令验证免密码登录。
本篇用来记录学校集群的密钥登录方法以及一些常用命令,以便实验查阅。 密钥登陆 首先进入集群界面,选择密钥登陆 然后设置密码,密码需要具有一定长度才能生效。 确定之后,在新作业这里下载生成的密钥。 打开Xshell,新建一个新的会话,名称随意,主机号如下图所示 选择接受主机密钥 这里的用户名输入集群的账号 选择公钥进行身份验证,上传刚刚下载的.key文件 密码输入之前设置的密码
弹性MapReduce (EMR)结合云技术和 Hadoop等社区开源技术,提供安全、低成本、高可靠、可弹性伸缩的云端托管 Hadoop 服务。您可以在数分钟内创建安全可靠的专属 Hadoop 集群,以分析位于集群内数据节点或 COS 上的 PB 级海量数据……
扫码关注腾讯云开发者
领取腾讯云代金券