首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何设计企业级数据分析平台

传统企业的OLAP几乎都是基于关系型数据库,在面临“大数据”分析瓶颈,甚至实时数据分析的挑战时,在架构上如何应对?本文试拟出几个大数据OLAP平台的设计要点,意在抛砖引玉。...一、突破设计原则 建设企业的大数据管理平台(Big Data Management Platform),第一个面临的挑战来自历史数据结构,以及企业现有的数据库设计人员的观念、原则。...企业大数据平台建设的二八原则是,将20%最有价值的数据——以结构化的形式存储在关系型数据库中供业务人员进行查询和分析;而将80%的数据——以非结构化、原始形式存储在相对廉价的Hadoop等平台上,供有一定数据挖掘技术的数据分析师或数据工程师进行下一步数据处理...而对大数据平台来说,对分析的需求会更细,包括: 查询:快速响应组合条件查询、模糊查询、标签。 搜索:包括对非结构化文档的搜索、返回结果的排序。...Cassandra数据库的设计采用上数据追加写入模式,可以支持实时批处理;流式计算平台则有Apache Storm、Yahoo S4等开源框架,商业平台有Amazon Kenisis(部署在云端)。

1.3K50
您找到你想要的搜索结果了吗?
是的
没有找到

企业级PaaS平台OpenShift

OpenShift及其发展简史 OpenShift是由RedHat推出的企业级Kubernetes平台,其主要目标是构建以OCI(Open Container Initiative)容器封装和Kubernetes...近十年来,我们的开发流程从瀑布到敏捷再到DevOps,应用架构从单体到多层再到微服务架构,软件交付与封装经历了物理机、虚拟机再到容器,应用运行的基础设施也从传统数据中心到主机托管再到云计算(如图1-12...image.png image.png 因此,借助OpenShift构建企业级云原生平台将会事半功倍。...因此,借助企业级开源PaaS平台OpenShift,企业云原生平台的构建将可一步到位。OpenShift已基本集成并实现了云原生平台所需的全部软件和功能。...作为云计算三模式中的后来居上者,PaaS服务随着容器技术、编排技术和微服务架构等云原生技术理念的普及应用,已基本实现对复杂信息系统的多层次全抽象,实现了裸机以上、代码以下全基础设施的抽象沉淀。

3.3K50

企业级数据库十设计原则

使用原则 3个基础原则与3个完备性原则是每个项目在设计数据库都需要遵守的,4个扩展性原则可以按需选择。...3个基础原则 结构清晰:表名、字段命名没有歧义,能一眼看懂 唯一职责:一表一用,领域定义清晰,不存储无关信息,相关数据在同一张表重 主键原则:设计不带物理意义的主键,有唯一约束,确保幂等 4个扩展性原则...长短分离:可以扩展,长文本独立存储,有合适的容量设计 冷热分离:当前数据与历史数据分离 索引完备:有合适的索引方便查询 不使用关联查询:不使用一切的SQL Join操作,不做两个表或者更多的关联查询...select.s.shop_name,o.id as order_id,o.total_amount from shop s,order o where s.id = o.shop_id 3个完备性原则 完整性:保证数据的准确性与完整性...,重要的内容都有记录 可追溯:可追溯创建时间,修改时间,可以逻辑删除 一致性原则:数据之间保持一致,尽可能避免同样的数据存储在不同表中

1.1K20

企业级开发平台的演进

通常,LOB 应用程序有下列特点: 特定领域 - 为特定领域的专业人员服务,而不是大众市场 全面的业务逻辑 - 包含大量自定义的业务逻辑和数据处理算法 以数据为中心 - 高度依赖关系型数据库,并且关系型数据库是应用程序的关键核心...使用平台开发的业务系统中所有的边界和限制都源自于此架构,因此,深入了解架构是非常必要的。比如,开发出来的业务系统适合什么样的场景?系统的扩展性怎样?是否模块化?可以用哪种类型的数据存储?...这种类型的应用有一些通用的需求,比如用户验证、数据访问限制、审计、文件存储、全文搜索、BPM 等等。RAD 平台满足这种需求是通过提供可重用的开箱即用功能或者扩展插件。...为了使非专业人士能创建企业级软件,LCDP 将开发过程缩减到只需要绘制流程图即可,但这种方式会牺牲很多其他的软件系统能力:协作开发、对源代码的掌控、可定制性、可扩展性、互操作性、兼容性、性能、自动测试等等...而且由于并非运行在可控的部署环境,导致切换供应商的难度也非常

59510

Lepus搭建企业级数据库慢查询分析平台

前言 Lepus的慢查询分析平台是独立于监控系统的模块,该功能需要使用percona-toolkit工具来采集和记录慢查询日志,并且需要部署一个我们提供的shell脚本来进行数据采集。...该脚本会自动开启您数据库的慢查询日志,并对慢查询日志进行按小时的切割,并收集慢查询日志的数据到监控机数据库。随后您通过Lepus系统就可以分析慢查询了。...lepus_server_id=1 # collect mysqlslowquery log into lepus database; # 收集慢日志存储到天兔监控数据库 $pt_query_digest...) long_query_time 查询超过多少秒才记录 展示 配置完成后,稍等片刻,即可在慢查询分析平台查看该库的慢查询日志。...小结 被监控监控机通过 percona-toolkit 工具和 shell 脚本来采集慢查询日志并发送到监控机,Lepus的慢查询分析平台对采集数据进行展示和分析。

1.4K20

Lepus搭建企业级数据库慢查询分析平台

前言 Lepus的慢查询分析平台是独立于监控系统的模块,该功能需要使用percona-toolkit工具来采集和记录慢查询日志,并且需要部署一个我们提供的shell脚本来进行数据采集。...该脚本会自动开启您数据库的慢查询日志,并对慢查询日志进行按小时的切割,并收集慢查询日志的数据到监控机数据库。随后您通过Lepus系统就可以分析慢查询了。...lepus_server_id=1 # collect mysqlslowquery log into lepus database; # 收集慢日志存储到天兔监控数据库 $pt_query_digest...) long_query_time 查询超过多少秒才记录 展示 配置完成后,稍等片刻,即可在慢查询分析平台查看该库的慢查询日志。...小结 被监控监控机通过 percona-toolkit 工具和 shell 脚本来采集慢查询日志并发送到监控机,Lepus的慢查询分析平台对采集数据进行展示和分析。

94810

企业级Hadoop、Spark平台应用、开发、整合企业级Hadoop、Spark平台应用、开发、整合

企业级Hadoop、Spark平台应用、开发、整合 公司从Hadoop向Spark整合,主要的业务需求是做实时性要求更高的一些业务 系列课程的重点就是: 实用的一些技巧, 调优的一些手段、 企业中实际应用的一个场景...根据企业的应用场景,我们如何用Hadoop、Spark去解决 在这里,聆听最专业的实战指引 和我们一起,学习最热门的大数据技术 课程大纲 大数据的故事 Hadoop的演变 企业级数据应用 大数据必备技能...平台一览 IOE VS HADOOP --IBM Oracle EMC 想必大家也都听说过, 前段时间很火的新闻,阿里巴巴去IOE的主角 数据仓库选型 集群部署、数据管理、任务调度、集群监控 Hadoop...集群的问题和限制 Hadoop DBA Hadoop企业级应用的成本考量 大数据的故事 很久很久以前...一般故事都是这么开头的 -实际上是在5年前 google的一个团队在《自然》杂志上发表了一篇论文...the answers 更极端的是《连线》杂志(Wired)的主编 chris Anderson 他也是长尾理论的提出者,他在2008年写了一篇文章《理论的终结》里面就说,所有的数学模型都是错的,数据已经到可以自己说出结论了

1.4K140

企业级实时数据平台为例,了解何为敏捷大数据

敏捷大数据,即在敏捷理念原则指导下,构建出一系列通用平台工具,和一整套大数据应用全生命周期方法学,以支撑更轻量、更灵活、更低门槛的大数据实践。本文从理论层面整体解释我们所理解的“敏捷大数据”。...一、敏捷大数据的理念原则 1.1 组件化/平台化/产品化/本地化 组件化/平台化:通过对大数据处理链路进行模块化抽象,形成多个功能高度內聚的组件化平台;组件化平台既可独立与已有平台组件整合使用, 也可组合起来以解决更多不同链路上的问题...二、可以抽象出的通用平台工具 以企业级实时数据平台为例,我们在敏捷大数据理念原则的指导下,对实时数据平台整体端到端进行了模块化切分,并形成一系列标准化协议,最后以统一开放的原则确定了要开发哪些通用平台工具及其边界和接口规范...[1530503601547097197.png] 上图是实时数据平台的概念模块架构图,在后续文章中我们会以实时数据平台为切入点,详细阐述衍生出的通用平台工具的抽象概念和架构设计。...“敏捷大数据”的定义,以及敏捷大数据理念,并且简要描述了基于这套理念之上如何构建平台栈和如何实践方法学。

40910

从选型到实现——企业级云端大数据平台最佳实践

IT 咖说(微信id:itdakashuo)作为独家视频合作方,经主办方和讲者审阅授权发布。...阅读字数:3289 | 9分钟阅读 摘要 很多企业在做大数据平台或大数据方案的时候,常常不知道该选用哪些产品来满足自己的需求。本次分享将从青云的云平台架构出发,探讨大数据平台的实践以及思考。...完整的企业级数据平台 一般的大数据平台架构首先面对的就是各种数据源,接着就是数据的传输,这里的传输层推荐使用Kafka。...Roadmap 大数据平台管理架构 青云不仅提供大数据的相关组件,还提供了管理这些组件的平台。...大数据平台+Appcenter2.0 大数据技术的变化太过迅速,我们无法提供所有的相关产品,所以需要在大数据平台下提供一个框架层,这样就可以将各种产品转化为服务集成到平台中。

1.2K30

2022企业级BI平台白皮书

数字化转型对规模型企业来说,应当是一个渗透企业的战略,也应当是一种赋能业务一线人员的方式,于是,此时规模型企业对企业级BI的需求空前旺盛。...企业级BI不仅要能够在业务需求角度以数据分析助力智能决策,还能够在组织升级和解决方案的多层次,满足规模型企业的复杂需求。...《2022企业级BI平台白皮书》是观远数据发布的业内首部聚焦规模型企业数字化转型,探寻BI平台企业级能力建设方法论的白皮书,也是观远数据基于多年来与超过400家先进企业携手数字化实践的经验沉淀与应对方案整合...白皮书从规模型企业数字化转型特有的挑战入手,针对企业丰富的数字化触点、规模化能力建设、智能决策、组织升级需求进行分析,梳理了规模化企业对于“企业级BI”能力的要求,建设性地提出了企业级BI“五力模型”,...以下为观远数据《2022企业级BI平台白皮书》内容节选,文末可下载完整白皮书: 本文内容来自观远数据《2022企业级BI平台白皮书》

26920

打造企业级移动测试云平台 | 洞见

与AWS device farm类似,SauceLabs和Xamarin也提供类似的平台,那SauceLabs的服务举例,如果想使用无限运行时间,支持24个并发运行设备,模拟器用户需要每月承担3576刀...安全性也是企业需要考虑的问题,用户不得不在云测试平台上传自己的IPA或APK。我们当然可以信赖AWS的安全机制。一些对安全性要求较高的企业来说,更想规避这样的风险。...打造私有移动真机测试平台 通过分析,对于客户的需求大概涵盖几点:真实设备、并发、成本、安全、可重用。...2.平台数据可视化 对于一个测试平台来说,如何把所有可用的服务(机器)、服务状态、自动重启和crash报告等数据可视化给企业终端用户,是极为重要的。...3.自动化测试运行和报告生成 自动化测试平台虽然提供了强大的服务(设备)管理、服务可视化等功能。而自动化测试的核心需求依然是如何保障测试的独立性、稳定性、易维护性、重用性和覆盖率。

1.8K50
领券