前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >大数据开发如何规避细节问题,换一个角度来解决常见的细节问题

大数据开发如何规避细节问题,换一个角度来解决常见的细节问题

作者头像
企鹅号小编
发布2018-01-29 15:07:46
7190
发布2018-01-29 15:07:46
举报
文章被收录于专栏:大数据大数据大数据

5.开发细节

5.1工程结构讲解

本书共一个系统架构,二个产品模块(离线和实现),四个项目包:Stormanalyse,Loggenerator, ClickStreamETL,SparkClickStream接下来分别来介绍对应的项目模块:

5.1.1离线项目代码目录结构

离线大数据日志处理由两部分组成,第一部分是Hadoop MR组成的ClickStreamETL项目,第二个是有Spark内存计算组成的SparkClickStream项目。

ClickStreamETL

Hadoop版本的日志处理分析Eclipse项目图示

开发代码UML项目结构图

代码文件组成结构(由于类图过大,故请到本书提供源下载)

SparkClickStream

Spark版本的日志处理分析

开发代码UML项目结构图

代码文件组成结构

5.1.2实时计算代码目录结构

实时计算代码由两部分组成,第一部分是loggenerator,负责仿造实时数据,进行数据解析,stormanalyse,是storm框架中代码开发实例,负责对数据进行处理的代码。

Stormanalyse

Storm版本的实时数据处理

Stormanalyse项目结果图

StormanalyseUML类图

Loggenerator

实时计算项目数据源模拟

Loggenerator项目结构图

LoggeneratorUML类图(由于类图过大,故请到本书提供源下载)

本文来自企鹅号 - ITStar媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文来自企鹅号 - ITStar媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
流计算 Oceanus
流计算 Oceanus 是大数据产品生态体系的实时化分析利器,是基于 Apache Flink 构建的企业级实时大数据分析平台,具备一站开发、无缝连接、亚秒延时、低廉成本、安全稳定等特点。流计算 Oceanus 以实现企业数据价值最大化为目标,加速企业实时化数字化的建设进程。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档