首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【案例】农业银行大数据平台项目——海量数据复杂运算处理

南大通用GBase 8a MPP Cluster产品也发展成为国内企业大数据、数据仓库领域基础平台软件的领先产品。...2013年8月,农行数据仓库正式立项,确定采用南大通用GBase 8a MPP Cluster与Hadoop的混搭架构。...2013年11月30日,数据仓库原型集群及资负、零售数据集市试运行(28节点MPP集群)。...2014年11月,数据仓库原型环境向生产环境(56节点MPP集群)的迁移与切换工作完成,迁移有效数据103T。 2014年12月,完成财会集市(16节点MPP集群)搭建。...关键技术2:MPP集群活架构示意图 通过运用GBase 8a MPP集群间同步工具识别主集群增量数据(以DC为单位),点对点传输至备集群,实现主备集群数据一致;同时结合大数据平台批量加工调度平台

7.2K100
您找到你想要的搜索结果了吗?
是的
没有找到

【文中有福利】Gdevops广州站:全链路监控、数仓集群、智能运维、混沌工程等实操解析

腾讯大讲堂·限时专属优惠 报名 福利一: 扫描下方二维码,关注腾讯大讲堂,回复“Gdevops全球敏捷运维峰会·广州站”,就有机会抽取免费门票 ? 福利二: 限时特价优惠门票有限,码上报名 ?...维稳618和11:京东科技数据库 海量运维的生态体系建设与实践 议题要点及收获: 如何建设海量数据和高并发场景下的数据库生态治理体系; 以6.18、11.11等大促为例的数据库海量运维经验; 数据库全生命周期管理...讲师介绍:8年MPP数据库工作经验,建行自研新一代MPP架构数据库龙趺MPP DB产品负责人,负责建行4000台Greenplum集群规划、搭建、运维和优化。...超大规模数仓集群 在大型商业银行的落地实践 议题要点及收获: 传统数据仓库服务并发能力不足如何应对; 传统数据仓库服务数据孤岛问题如何解决; 超大规模数仓集群运维优化最佳实践。 ?...什么收益? 如何通过主动注入故障,提前发现潜在问题,持续改进应用架构和运维方式,确保应用的韧性; 腾讯游戏的混沌平台建设、红蓝对抗等实战经验。 ?

6.5K30

数据库架构比较

这通常会使这个选项变得昂贵,尽管(理论上)它可以部署在廉价的商用服务器上,实际上,它通常部署在具有冗余磁盘,网络连接和电源的企业级硬件上。...MPP体系结构是数据仓库和分析平台的出色解决方案,因为查询可以分解为组件部分,并在服务器之间并行执行,从而显着提高性能。...“通过大规模并行处理(MPP)设计,查询通常比在对称多处理(SMP)系统上构建的传统数据仓库快50倍”。-微软公司。...成本和高可用性:一些基于MPP数据仓库解决方案旨在在廉价的商用硬件上运行,而无需可能包含成本的企业级冗余组件。这些解决方案通常使用自动数据复制来提高系统弹性并确保高可用性。...在此期间,关于数据仓库是否已经死亡以及Hadoop是否会取代 MPP平台的讨论很多,尽管普遍的共识似乎表明Hadoop充其量只是数据仓库的补充技术; 不是它的替代品。 什么是Hadoop?

3.9K21

大数据数据仓库—概念

数据仓库 ,由数据仓库之父比尔·恩门(Bill Inmon)于1990年提出,主要功能仍是将组织透过资讯系统之联机事务处理(OLTP)经年累月所累积的大量资料,透过数据仓库理论所特有的资料储存架构,作一系统的分析整理...2,大数据技术相比传统的数据仓库什么优势? 搞来搞去,又回到了传统的数据仓库?事实上,大部分企业的应用传统数据仓库支持就非常好。...对于小于100T的结构化数据处理时,往往会发现MPP架构的数据仓库反而性能更高。但是数据仓库非常明显的扩展瓶颈,目前已知的,最大生产数据仓库节点数据大概是几百个节点。...传统数据仓库,还停留在统计,钻取这些传统的BI分析方法。大数据技术衍生出非常多的交互式,BI工具等。 相比传统数据仓库,大数据也有很多劣势:1)小数量下面,比传统的mpp差。...所以业界不少厂商在做这方面的探索,如cloudera的impala,星环的Inceptor,阿里的ads。 本文先介绍数据仓库的基本概念,下一篇介绍大数据数据仓库的应用场景。

97460

【揭秘】中国四大银行的大数据应用已到了哪个阶段?

01 中国建设银行信息技术管理部资深经理林磊明 1)银行压力越来越大 从十二五走到十三五期间,银行业面临的各方面的压力越来越大,从我们的年报数字可以看出去年四大行的利润增长基本上趋近于零增长。...还用传统的?新型的怎么样? 金融在有些技术的选择上还是相对比较保守的,我们不会用的技术,不会用的版本,这也因为金融工委和国家人民银行对于我们的连续服务要求特别高,一旦出了事情领导交不了差。...MPP数据库,我们搭建了活机制,两个库之间的同步加验证现在每天大概是22TB的数据,仅需要3小时。...我们做了MPP和Hadoop的交互,有些应用要交互,我们做了非结构化MPP和HDFS之间的融合。...后来启用了MPP和Hadoop之间的备份,大大提高了效率,300T也需要将近20个小时,所以我们做了活,如果活稳定的话我们就不用备份数据了。

75030

四大银行(工建农中)大数据进展如何?

中国建设银行信息技术管理部资深经理林磊明 ▼ ▼ 1、银行压力越来越大 从十二五走到十三五期间,银行业面临的各方面的压力越来越大,从我们的年报数字可以看出去年四大行的利润增长基本上趋近于零增长。...还用传统的?新型的怎么样? 金融在有些技术的选择上还是相对比较保守的,我们不会用最新的技术,不会用最新的版本,这也因为金融工委和国家人民银行对于我们的连续服务要求特别高,一旦出了事情领导交不了差。...MPP数据库,我们搭建了活机制,两个库之间的同步加验证现在每天大概是22TB的数据,仅需要3小时。...我们做了MPP和Hadoop的交互,有些应用要交互,我们做了非结构化MPP和HDFS之间的融合。...后来启用了MPP和Hadoop之间的备份,大大提高了效率,300T也需要将近20个小时,所以我们做了活,如果活稳定的话我们就不用备份数据了。

1.9K40

MPP技术的优势与严重缺陷

MPP架构通常用于处理海量数据的应用程序,如数据仓库、商业智能和大数据分析。 MPP常见的发力场景是数据仓库。...Apache Cassandra (支持 MPP 模式) MPP技术的出现,它重要的历史意义。单机数据库的存储和计算性能有限,MPP这种以多节点的形式进行共同存储与计算的技术就应运而生。...假设生产中的每天的硬盘故障率为1%,如果MPP集群500块硬盘(每台服务器5块数据盘,100台服务器),那么每天至少有5块盘出现故障。数据盘故障就会导致严重的木桶效应,甚至导致数据丢失。...那么MPP的常见的缺陷就能推出: MPP数据仓库通常需要更多的硬件资源和投资,价格较高,不适合所有的企业规模和预算。 MPP数据仓库的部署和维护需要更专业的技术人员,技术门槛相对较高。...MPP技术当然它的优势:在中小规模的数据量下,处理结构化数据功能完整,易用,性能出色。但数据量一旦超过它能承受的上限,木桶效应,扩展性问题就会变为难以忽略的维护成本。

45330

数据仓库模型全景

,包括: 业务需求:从了解业务需求着手分析业务特点和业务期望; 系统架构:从系统架构和数据分布、数据特性等角度,分析系统架构设计上是否问题; 逻辑设计:从数据模型逻辑设计出发是否设计合理,是否符合数据库开发和设计规范等...前面讲了数据仓库的价值、构建思路、实例,完成数据仓库的概念、逻辑、物理模型设计后,数仓的产品选型也是需要考虑的部分,根据数据存储量、查询效率、并发能力可以选用MPP数仓和基于Hadoop的分布式数仓等...一、MPP还是Hadoop 这里继续用之前用到的图讲解,数据仓库的特性是处理温数据和冷数据,面向业务分析提供偏于离线分析能力,因此一般选用Hadoop+MPP数仓结合的解决方法,Hive能够提供大批量历史数据的存储计算能力...,Hbase能够提供半结构化文档的快速检索能力,MPP能够提供强大高压缩比基础上的快速查询能力; 二、MPP数仓特性 在MPP解决方案中目前我已接触过的是vertica和GP,在teradata实习期间没有用到.../slave模式,具备统一的查询入口(master),vertica是无中心架构,所有节点都提供查询服务,gbase是存储/管理中心架构; shared nothing 模式:x86机器构建计算/存储的高扩展集群

1.1K20

11的第14年:进化与回归

目前尚不清楚两家企业统计的数据口径何不同,但争第一的热情不减。以往的双十一,各大品牌会对平台的流量扶持更依赖,但今年11的一大变化是,品牌商自全域导流的能力在增强。...消费者还需要12双十一京东、淘宝未公布GMV,但并不影响12的备战热情。11刚刚结束,淘宝就开始紧锣密鼓地筹备12购物节商家招募工作。...对于消费者来说,消费者还需要12接力?...双十一的时间跨度正好处于国庆节过后与圣诞节之间的黄金时段,而双十二的时段则显得较为尴尬,由于双十一购买的产品还未耗尽,双十二就更显得狗尾续貂。...写在最后:历经14年的发展,中国的11在世界范围内也已经与美国黑色星期五齐名之势。美国的黑五起源于1924年,至今98年的历史,黑五最大的特点是商品价格相当优惠,折扣简单直接。

28K30

DNSPod十问简丽荣:国产数据库的月亮与六便士

这段工作经历对你的创业什么帮助? 简丽荣:2010年从港科大毕业之后,我在IBM中国研究院从事云计算方面的研发工作。...你能借这个机会给大家讲解一下什么才是真正的云端数据仓库?云原生数据库与传统数据库对比什么主要差异?...我们评估一款产品是否属于真正的云原生数据仓库,不是简单看它是否是分布式,而是看它是否能够充分发挥云平台的这些优势特性。 我给大家举两个简单的例子,来解释云原生数据仓库和传统MPP数据库的差异。...但传统MPP数据库的计算和存储是紧耦合的,扩容时涉及到数据的重分布,而数据仓库里的数据量一般比较多,完成一个数据重分布要花几个小时。...你看好云原生数据库

1K20

【大数据100分】大数据架构及行业大数据应用(中级教程)

这类MPP产品可以有效支撑PB级别的结构化数据分析,这是传统数据库技术无法胜任的。对于企业新一代的数据仓库和结构化数据分析,目前最佳选择是MPP数据库。 ?...多数领导基本上认为花了很多钱,但看不出是否值得做,鸡肋的感觉。最后大家对大量的报表都视而不见了。 这类系统属于“高富帅”,是有钱的企业给领导用的。 最后,目前多数企业和部门根本就没有数据仓库。...牛一壹:这是将MPP与Hadoop集成,统一管理,目前市场上有这样的管理平台?...吴东亚:再问个问题,国外除了政府,科学数据外,行业数据有开放先例可借鉴学习的法律? 武新:我所知道的,比如:气象数据、人口数据等。需要参考西方发达国家的法律,隐私在西方是至高无上的问题。...董健:就是刚才武总说的一体机系列,一体机在节点之间的配合上确实比开放式结构的MPP很多优势,虽然PDA号称也是MPP

1.1K150

数据仓库构建方法论和简单实践

开标:开标一般是线下进行,代理机构把投标人召集到开标室,公开宣读投标人关于投标人报价、工期、质量、工程项目经理等投标人实质要求的内容,此阶段拆封投标文件,解密电子的投标文件; 评标:评标一般是线下进行...前面讲了数据仓库的价值、构建思路、实例,完成数据仓库的概念、逻辑、物理模型设计后,数仓的产品选型也是需要考虑的部分,根据数据存储量、查询效率、并发能力可以选用MPP数仓和基于Hadoop的分布式数仓等...一、MPP还是Hadoop 这里继续用之前用到的图讲解,数据仓库的特性是处理温数据和冷数据,面向业务分析提供偏于离线分析能力,因此一般选用Hadoop+MPP数仓结合的解决方法,Hive能够提供大批量历史数据的存储计算能力...,Hbase能够提供半结构化文档的快速检索能力,MPP能够提供强大高压缩比基础上的快速查询能力; 二、MPP数仓特性 在MPP解决方案中目前我已接触过的是vertica和GP,在teradata实习期间没有用到.../slave模式,具备统一的查询入口(master),vertica是无中心架构,所有节点都提供查询服务,gbase是存储/管理中心架构; shared nothing 模式:x86机器构建计算/存储的高扩展集群

67120

何鸿凌:电信行业大数据应用案例的实践及思考

数据仓库的构建、维护、运营方面有丰富的实践经验,对数据分析方法和数据挖掘方法深刻的理解。...大家知道?去年中国移动卖出的终端1.5亿部。一下子就把世界上T制式的智能终端和W以及C制式智能终端的稳固比例打破了。现在TD-SCDMA芯片已经是主流了。...目前我们的大数据参考架构是MPP和Hadoop混搭,加上原有利旧的数据仓库系统,如下图。...,上了联通的号 Q5颜苑:@何鸿凌-中国移动 在移动医疗的应用例子?...我个问题:你们对原始数据作主数据的降维处理? 何鸿凌:@金耀星 运营商做法类似,清洗,转换。保留稳定下来的数据。以前明细存得不长。现在要越来越长。

1.8K80

Snova数仓简介

Snova为您提供简单、快速、经济高效的PB级云端数据仓库解决方案。...借助于Snova,您可以在数分钟内创建拥有数百节点的企业级云端数据仓库,并高效的完成日常维护工作;也可以使用丰富的Postgre开源生态工具,实现对Snova中海量数据的即时查询分析、ETL处理及可视化探索...性能卓越 基于分布式大规模并行处理MPP框架,可线性扩展存储及计算能力。支持行列混合存储,可按业务需求选择最佳存储方案。查询引擎深度优化,查询效率数倍于传统数据仓库。...安全可靠 节点同步冗余,实现用户无感的故障转移和容灾备份。分布式部署,计算单元、服务器、机柜三重防护,提高重要数据基础设施保障。用户集群独立部署,支持VPC隔离,数据访问安全多重保障。...借助于Snova数据仓库,在金融、零售、互联网、游戏等多个领域,可方便地搭建用于经营分析决策、海量日志分析、用户行为实时洞察等场景的一套解决方案。

1.8K20

MPP DB技术分类

但NUMA技术同样一定的缺陷,由于访问异地内存的时延远远超过访问本地内存,因此,当CPU数量增加时,系统性能无法线性增加。...4.NUMA与MPP的区别 从架构来看,NUMA与MPP许多相似之处:它们都由多个节点组成;每个节点都有自己的CPU、内存、I/O;节点之间都可以通过节点互联机制进行信息交互。那么二者的区别在哪里?...而在MPP服务器中,每个节点只访问本地内存,不存在异地内存访问的问题。 5.数据仓库的选择 哪种服务器更加适应数据仓库环境?这需要从数据仓库环境本身的负载特征入手。...另外,这种并行处理能力也与节点互联网络很大的关系。显然,适应数据仓库环境的MPP服务器,其节点互联网络的I/O性能应该非常突出,这样才能充分发挥整个系统的性能。...6.MPP数据仓库架构分类 前面讲到MPP架构非常复杂,通常用到数据库系统来屏蔽节点间的负载平衡和调度的复杂性。

3.4K60

通用抽奖工具之需求分析

比如双十二期间三天、每天三场整点红包雨配置。...活动、场次配置: 双十二答题闯关 活动配置: 2019-12-10 ~ 2019-12-12 场次配置: 00:00:00 ~ 23:59:59 奖品配置: 表格可左右滑动 双十二答题闯关 奖品 第一关...自动概率,根据当前奖品的数量和奖品的权重得到中奖概率 比如我们某次大促活动红包雨的配置如下: 表格可左右滑动 活动配置 描述 活动时间 2019-12-10~2019-12-12 活动名称 2019十二大促整点红包雨...活动描述 2019十二大促全端整点红包雨活动 手动设置奖品概率 是 场次 奖品类型 具体奖品 奖品数量 中奖概率 10:00:00 ~ 10:01:00 优惠券 2元优惠券 2000 50% -...以双十二幸运大转盘为例: 场次 奖品类型 具体奖品 奖品数量 中奖概率 投奖时间(默认提前5分钟投奖) 投奖数量 00:00:00 ~23:59:59 优惠券 2元优惠券 2000 50% - - -

6.3K20

MPP架构与Hadoop架构是一回事

不过由于MPP的字面意思,现实中还是经常有人纠结两者到底什么联系和区别,两者到底是不是同一个层面的概念。...那么,MPP架构的Master做的什么事呢?它会接收SQL语句,解析它并生成执行计划,将计划分发到各个节点。那么,这与Spark SQL区别?...MPP架构虽然也是指的“大规模并行处理”,但是由于提出者是数据库厂商,所以MPP架构在很多人眼中就成了“分布式数据库”的代名词,它处理的也都是“结构化”的数据,常常作为企业数据仓库的解决方案。...当然,Hadoop生态圈也要考虑“结构化”的数据,这时Hive就成了Hadoop生态圈的数据仓库解决方案。但是,Hadoop、Spark等框架的理论基础与分布式数据库仍然是一样的。...两者还有区别?前文在MPP架构的概念、历史以及技术细节上与Hadoop架构做了对比,了解到了两者一些极为相似的地方,而且在广义上讲,Hadoop就是MPP架构的一种实现。

2.4K30

国产数据库|聊聊南大通用 GBase 数据库

今天来聊一聊分析型数据管理系统 GBase 8a 它是面向大数据分析类应用领域的一款高性能国产新型数据库产品,用于满足数据密集型行业日益增大的数据查询、数据统计、数据分析、数据挖掘和数据备份等需求,可用做数据仓库系统...GBase 8a MPP Cluster GBase 8a MPP Cluster 数据库,南大通用大规模分布式并行数据库集群系统,简称:GBase 8a MPP Cluster,GBase 8a MPP...GBase 8a MPP Cluster 采用 Shared Nothing MPP 的联邦架构,灵活部署,采用计算存储节点和管理节点集群的两级部署结构,无单点故障,扩展性好,管理集群最多支持部署 64...(GBase 8aMPP Cluster 产品架构图 ) (GBase8a MPP Cluster 技术特点图) 核心技术就是:单节点数据行列混存存储技术和MPP 大规模并行计算技术。...这里吐槽一点儿唯一不好的是文档会直接下载,没有在线阅读,建议在线阅读的选项。

6.3K10
领券