首页
学习
活动
专区
工具
TVP
发布

最新最全的大数据技术体系

专栏作者
717
文章
540391
阅读量
33
订阅数
大数据物流项目中CM的安装与运用
文章目录 大数据服务器之CM安装架构及目录 大数据服务器之CDH框架安装细节 大数据服务器之CM安装架构及目录 ​ 针对整个物流项目来说,1台虚拟机安装部署大数据环境:基于CM6.2.1安装CDH6.2.1。 关于CM功能及CM安装,不再过多赘述,项目还是要注重于业务及数据和实现。 📷 提供虚拟机【node2.itcast.cn】解压后,导入VMWare 软件中,启动虚拟机即可(选择我已移动该虚拟机) 1)、启动之前,设置node2.itcast.cn内存:4GB或者6GB或者8GB即可 2)
Maynor
2022-05-08
5260
大数据物流项目中CM的安装与运用
文章目录 大数据服务器之CM安装架构及目录 大数据服务器之CDH框架安装细节 大数据服务器之CM安装架构及目录 ​ 针对整个物流项目来说,1台虚拟机安装部署大数据环境:基于CM6.2.1安装CDH6.2.1。 关于CM功能及CM安装,不再过多赘述,项目还是要注重于业务及数据和实现。 📷 提供虚拟机【node2.itcast.cn】解压后,导入VMWare 软件中,启动虚拟机即可(选择我已移动该虚拟机) 1)、启动之前,设置node2.itcast.cn内存:4GB或者6GB或者8GB即可 2)
Maynor
2022-05-08
3950
今日指数项目之需求调研【三】
大数据平台作为底层的基础数据平台,集群规模、计算存储性能将决定流、批的性能指标上限。所以需要考虑整个大数据平台的吞吐量(网络、磁盘IO)、响应速率、计算能力、高并发性、高可用、维护性方便等,以满足多业务场景下,不同应用需求的建设任务,比如多维分析、实时计算、即席查询和数据统计分析等应用功能。 本项目大数据平台在建设过程中,将满足如下性能指标: 批处理部分指标: 支持批处理集群批量总写入速度2GB/秒,批量读取速度300MB/秒; 平台支持并发执行300个查询和200个加载任务; 应用查询时间对于数据库的简单数据读取将不超过1~2秒,三个月统计计算查询时间将不超过15秒,复杂查询时间将不超过1分钟; 复杂批处理任务,ETL的处理时间将不超过2个小时; 实时流处理指标: 平台支持接收峰值为每秒100万条+的流数据; 平台能够在峰值条件下,完成2秒内的实时预警,2秒内完成针对当日数据的查询; 平台每日实时处理模块能够累积处理144亿笔(按4小时交易日保持峰值流速计)订单流数据; 平台支持至少50个并发访问/查询当日数据。 应用响应指标: 数仓应用项目离线报表30秒内完成数据响应查询; 实时大屏数据展示5秒内完成数据响应查询; 应用平台支持并发执行500个用户查询请求;
Maynor
2022-04-11
2890
Apache Impala 的安装部署
4.配置本地yum源 4.1.上传安装包解压 使用sftp的方式把安装包大文件上传到服务器/cloudera_data目录下。
Maynor
2021-04-09
1.1K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档