首页
学习
活动
专区
工具
TVP
发布

#emr

「EMR 开发指南」之 Oozie 作业调度

岳涛

腾讯 · 大数据SRE研发工程师 (已认证)

本文将使用oozie组件自带的例子,详细介绍如何在oozie workflow上提交一个MapReduce jar。 本文以oozie 4.3.1版本为例。

11810

「EMR 开发指南」之 Kylin 存算分离方案

岳涛

腾讯 · 大数据SRE研发工程师 (已认证)

在大数据领域,数据量持续增长,数据类型和来源也变得越来越复杂。传统的数据仓库和分析工具很难满足大规模数据处理和实时分析的需求。为了解决这些问题,Apache K...

29821

「EMR 运维指南」之 Kylin 迁移方案

岳涛

腾讯 · 大数据SRE研发工程师 (已认证)

在大数据领域,数据量持续增长,数据类型和来源也变得越来越复杂。传统的数据仓库和分析工具很难满足大规模数据处理和实时分析的需求。为了解决这些问题,Apache K...

34031

「EMR 开发指南」之 Kylin 快速构建 Cube

岳涛

腾讯 · 大数据SRE研发工程师 (已认证)

在大数据领域,数据量持续增长,数据类型和来源也变得越来越复杂。传统的数据仓库和分析工具很难满足大规模数据处理和实时分析的需求。为了解决这些问题,Apache K...

30910

「EMR 运维指南」之 Kerberos 跨域互信配置

岳涛

腾讯 · 大数据SRE研发工程师 (已认证)

在两个集群在emr-header-1节点上,执行 hostname 命令获取hostname。在emr-header-1节点的/etc/krb5.conf文件中...

33230

「EMR 运维指南」之 Kerberos 跨域认证方案

岳涛

腾讯 · 大数据SRE研发工程师 (已认证)

多个开启 kerberos 的 hadoop 集群之间要做通信(跨集群的数据迁移等),因为 Kerberos 原因无法正常进行,本文档说明了多 kerberos...

27740

「EMR 运维指南」之 HiveServer2 启用 Custom 鉴权

岳涛

腾讯 · 大数据SRE研发工程师 (已认证)

HiveServer2 服务默认不启用鉴权功能,这样的话随意输入密码都能连接上,容易造成安全隐患,下面讲解下如何配置Hiveserver2 的 Custom 鉴...

31280

「EMR 运维指南」之 Impala 关联 Sentry + Hue

岳涛

腾讯 · 大数据SRE研发工程师 (已认证)

在EMR集群带公网master节点部署sentry服务,Impala的GROUP组需要在Impala server节点上进行创建系统组与之关联。

420111

搜狐智能媒体基于腾讯云大数据 EMR 的降本增效之路

腾讯QQ大数据

2022年,搜狐智能媒体完成了迁移腾讯云的弹性计算项目,其中大数据业务整体都迁移了腾讯云,上云之后的整体服务性能、成本控制、运维效率等方面都取得了不错的效果,达...

26940

自建大数据平台迁移腾讯云EMR最佳实践

腾讯QQ大数据

自建开源大数据平台会随着企业数据的增长遇到:性能慢、扩容周期长、平台稳定性差、运维难、投入成本高等问题。在这里我们将从 EMR 的简介、EMR与自建Hadoop...

28220

基于cos的hadoop KMS HA部署

王旭平

腾讯科技有限公司 · 产品架构工程师 (已认证)

hadoop 的 kms的元数据是保存在本地的,比如加密的请求打到A,元数据保存在A机器上,如果解密的请求打到B机器上,就会失败。为了解决这个问题,使用cos作...

56881

EMR 实战心得浅谈

深度学习与Python

作者|吴建阳 翁建清 策划|褚杏娟 AWS Elastic MapReduce(以下简称 EMR) 是集齐数据接入、存储、计算、交互式查询、机器学习等一系...

1.9K10

hive 处理已经存在的小文件方案

王旭平

腾讯科技有限公司 · 产品架构工程师 (已认证)

归档,archive。Hive 具有内置支持,可将现有分区中的文件转换为 Hadoop 存档(HAR),这样一个曾经由 100 个文件组成的分区只能占用约 3 ...

7.7K60

自建迁移EMR实践案例

腾讯云大数据

自建开源大数据平台会随着企业数据的增长遇到:性能慢、扩容周期长、平台稳定性差、运维难、投入成本高等问题。在这里我们将从 EMR 的简介、EMR与自建Hadoop...

3.3K140

基于SSSD同步OpenLDAP账号

王旭平

腾讯科技有限公司 · 产品架构工程师 (已认证)

涉及组件版本为:hdfs-3.2.2,yarn-3.2.2,openldap-2.4.44,spark-3.2.2,krb5-1.15.1

1.1K30

“数智话”技术沙龙 第四期 | 弹性MapReduce(EMR)专场内容回顾!

腾讯云大数据

1月10日晚19:00,腾讯云大数据“数智话”技术沙龙 第四期《EMR&StarRocks携手共建云端开源大数据生态》直播圆满落幕。本次沙龙围绕腾讯云大数据沉淀...

32450

StarRocks支持元数据加速桶配置(S3协议)

王旭平

腾讯科技有限公司 · 产品架构工程师 (已认证)

注,本次使用腾讯云EMR的 StarRocks-V1.1.0  ,starrocks-2.2.2

1.3K70

腾讯云官方课:EMR数仓全套教程重磅首发

腾讯云开发者

这几天把跨年搞的和人生分水岭似的🤪 2023年的你有什么不一样了吗? 是不是还和去年一样的造型? 新姿(知)势(识),学起来 腾讯云开发者社区带着干货来了 腾讯...

1.1K30

“数智话”技术沙龙第四期 | 弹性MapReduce(EMR)专场,报名中!

腾讯云大数据

1月10日晚19:00,腾讯云大数据“数智话”技术沙龙 第四期《EMR&StarRocks携手共建云端开源大数据生态》准时开启线上直播。本次沙龙围绕腾讯云大数据...

40950

hive 分区表添加字段后,字段结果为null

王旭平

腾讯科技有限公司 · 产品架构工程师 (已认证)

由于业务需要,添加了在hive原来的表上增加了新字段(alter table partition_test add columns(ads string); )...

2.1K20
领券