首页
学习
活动
专区
工具
TVP
发布

Hadoop实操

专注Apache Hadoop,CDH和HDP的实操,如安装部署,安全配置,排障过程,经验分享,性能
专栏作者
970
文章
2354891
阅读量
704
订阅数
0885-7.1.6-如何对CDP中的Hive元数据表进行调优
作者:唐辉 1.文档编写目的 在日常使用中,我们可以发现在hive元数据库中的TBL_COL_PRIVS,TBL_PRIVS 、PART_COL_STATS表相当大,部分特殊情况下NOTIFICATION_LOG也可能存在问题,如果集群中有关联的操作时会导致元数据库响应慢,从而影响整个Hive的性能,本文的主要目的通过对Hive 的元数据库部分表进行优化,来保障整个Hive 元数据库性能的稳定性。 测试环境 1.CDP7.1.6 、启用Kerberos 2.元数据版本 MariaDB-5.5.60 2.问题
Fayson
2022-08-26
2.1K0
0773-1.7.2-CDSW1.7的新功能
Cloudera Data Science Workbench仅支持从版本1.5.x和1.6.x升级到版本1.7.1。如果使用的是CDSW的早期版本,则必须首先升级到1.5.x或1.6.x版,然后再升级到1.7.1版。
Fayson
2020-05-25
1.2K0
DataX在有赞大数据平台的实践
有赞大数据技术应用的早期,我们使用 Sqoop 作为数据同步工具,满足了 MySQL 与 Hive 之间数据同步的日常开发需求。
Fayson
2019-06-17
2.2K0
0638-6.1.0-Cloudera Manager配置TLS
本文档主要介绍如何为已经安装好的CDH集群配置Cloudera Manager启用TLS。
Fayson
2019-05-23
2.1K0
0623-6.2.0-如何在CDH中安装CFM
2019年4月15日,Cloudera在其官网宣布GA两款新的产品Cloudera Flow Management和Cloudera Edge Management,即CFM和CEM。Flow Management和Edge Management以前都是隶属于HDP的相关产品,Cloudera此次官宣代表的是它们现在可以与CDH一起安装并使用,包括使用Cloudera Manager进行简易的Parcel安装和服务监控。HDP和CDH合并后,对于CDH的客户也一直期待HDP的一些优秀特性能早点融合到CDH中,CEM和CFM就是一次开始,它们为IOT场景的边缘管理和边缘数据搜集带来了可能。具体参考《0603-Cloudera Flow Management和Cloudera Edge Management正式发布》。
Fayson
2019-05-15
2.3K0
Druid 在有赞的实践
Druid 是 MetaMarket 公司研发,专为海量数据集上的做高性能 OLAP (OnLine Analysis Processing)而设计的数据存储和分析系统,目前 Druid 已经在 Apache 基金会下孵化。Druid 的主要特性:
Fayson
2019-03-07
1.8K0
0489-CDSW中用户Session访问外部数据目录
在使用CDSW1.4的过程我们发现,用户从本地上传到工程的数据文件不能正常访,有时会出现上传的数据文件权限及属主为root,有时上传较大的数据文件时会失败(基于浏览器的上传数据文件较大的原因),这里我们可以使用CDSW提供的Mounts功能挂载CDSW服务器上是数据盘解决该问题。使用外挂的数据目录方便数据共享且用户启动中会话能够实时读取到最新的外挂的数据,也避免了浏览器上传大数据文件失败的问题。
Fayson
2018-12-29
5520
没有更多了
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档