首页
学习
活动
专区
工具
TVP
发布

A2Data

专栏作者
373
文章
384173
阅读量
30
订阅数
论__CDH5躺过的坑
(注:此处为方便下载已经传入云盘,请在后台回复CDH5 自动获取下载地址(包含本文所有软件包))
DataScience
2020-04-14
1.1K0
趣搭-嗒集群
将jdk-7u25-linux-i586.tar.gz 分别传到每台机器的/TMP下
DataScience
2020-04-14
1.3K0
cloudera第7天
Cloudera实时初学者教程 欢迎来到Cloudera QuickStart VM, Cloudera Live的一部分!跟随本教程,您不仅将了解如何开始使用CDH (Cloudera的开源发行版,包括Apache Hadoop)中提供的一些工具,还将了解提出更大的问题意味着什么。在本教程结束时,您将: 了解如何在CDH中使用一些强大的工具 了解如何设置和执行一些基本的商业智能和分析用例
DataScience
2019-12-30
3490
cloudera第六天
Cloudera Manager为CDH的简单部署和管理提供端到端系统管理。Cloudera Manager还与现有的第三方工具无缝集成。 在桌面上点击“Launch Cloudera Express”或“Launch Cloudera Enterprise (trial)”即可启动。
DataScience
2019-12-30
4070
cloudera 第四天 Flume
Flume是一个可伸缩的、实时的摄取框架,它允许您路由、筛选、聚合和执行数据的“小型操作”,并将其传送到一个可伸缩的处理平台,如CDH。但是,您确实希望最小化在进入集群的过程中完成的逻辑,这将确保其他工作负载的可用性,并防止摄取瓶颈。它仍然允许您利用CDH集群的巨大可伸缩性进行更繁重的处理。如果您需要执行一些繁重的聚合或多步传入数据的ETL,那么您应该使用Spark—一个内存中的处理框架,它可以与处理框架的其他部分进行扩展,并内置了高级的分析功能。
DataScience
2019-12-30
3750
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档