前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Apache Spark在海致大数据平台中的优化实践

Apache Spark在海致大数据平台中的优化实践

作者头像
王知无-import_bigdata
发布2019-12-19 15:17:23
7600
发布2019-12-19 15:17:23
举报
本文来自由海致网络技术公司翟士丹分享。专注于大数据技术领域,Apache Spark Contributor,有丰富的Spark SQL引擎调优经验。

海致全称海致网络技术公司,成立于2013年7月。作为一家技术驱动的创业型公司,海致的创始班底拥有丰富的技术经验。核心团队成员来自百度、微软、IBM、EMC、硅谷等知名企业的资深互联网专家。

大数据数据平台的核心组成部分

  • 多数据整合
  • 自助式数据准备
  • 可视化探索式分析
  • 安全快捷的分发机制
  • 覆盖全面的应用场景

产品架构如下:

平台的整体技术架构如下:

多数据整合,形成统一的数据口径:

灵活易用高性能的可视化探索式分析:

大数据平台的技术挑战与建设难点

数据同步:

OLAP任意多维分析引擎实现:

数据建模系统实现:

机器学习实现:

性能及稳定性优化:

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-12-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据技术与架构 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 大数据数据平台的核心组成部分
  • 大数据平台的技术挑战与建设难点
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档