弹性 MapReduce (EMR)

最近更新时间:2023-12-01 11:51:31

我的收藏
此文将讲解如何将云数据源弹性 MapReduce (EMR)进行接入。

接入流程

新建项目后,在数据 > 数据源 处,选择“新建数据源”。

云数据源 > 云上大数据处,选择“EMR”



选择后需输入下图所示参数,各项参数释义如下:



数据源显示名:在BI上展示的名称,最大不超过45个字符。
地域:该数据源所属的地域,请正确进行选择,后续实例的选择只会拉取该地域下的实例。如果选择实例时找不到需要的实例,请检查地域选择是否正确。



实例:根据您选择的地域,拉取出该地域下您购买的实例以供选择。展示形式为“实例名称(实例ID)支持对实例名称进行模糊搜索,实例ID进行精确搜索,以供快速选择实例。


组件:根据您选择的EMR实例,将拉取该实例版本支持的emr组件。目前仅支持hive组件
节点IP:访问数据库的节点服务器的IP地址,可通过指定节点IP对访问数据库的流量进行切割。若无通过指定节点IP对访问数据库流量进行切割的需求,任意选择一个即可.
编码:数据库的编码格式,目前支持三种格式:“utf8”、“gbk”、“latin1”
数据库名称:数据库的名称
用户名&密码:数据库对应的用户名和密码

EMR需通过私有连接,来进行腾讯云内网的安全访问,通过私有连接能够有效避免公网访问带来的潜在风险,大大提高数据的安全性,详见:私有连接



当信息输入完成后,可单击底部一键测试进行连通性测试,若如下图所示提示“数据源连通性异常”,则代表连接失败,此时请先检查用户名、密码等连接信息是否填写有误。

若连接成功,则会如下图所示进行提示,此时可单击确认进行新建。

新建后,则会在列表中新增一行记录,此时代表已新建完成。如果有需要修改的信息,可单击编辑进行修改。新建完成后,即可进行建立数据表操作,详情请见:新建数据表

EMR Ranger说明

由于 EMR 提供了 Ranger 服务,用户可以通过 Ranger 实现对集群中数据的安全访问。因此建议连接 EMR 前打开 EMR ranger 服务,以提升连接安全性。此为 EMR 产品提供的能力,详见 EMR 产品文档:Ranger 简介