首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

数据湖浅谈

在业务流程是指根据业务规则直接产生的数据,数据湖保留了数据的原格式,原则上不对数据进行清洗、加工。...总而言之,数据源采集后到了SDI层,经过清洗整合后到了DWI层,经过数据封装到了数据接口层,能够提供公共数据接口并用于数据消费。经过主题联接又到了DWR层。...DWR-Data Warehouse Report 数据仓库报表,数据来源于DWI,不能直接层或从源系统取数据,采用维度模型方法建模。...数据服务(API) API中心检索数据服务,并进行API订阅。...备案过的数据分析应用或平台才允许走数据集成的方式出湖(如IPD领域的数据分析台),而且集成到这些分析平台的数据也必须进行严格管控,不允许再次搬家。

3.7K11

做全球最大的司法信息资源库——中国司法大数据服务网上线记

历经全国法院全覆盖、案件数据全覆盖、统计信息全覆盖三个递进阶段,建成了涵盖数据管理、共享交换、数据服务三大功能,具有实时自动、一数一案、协同共享、动态交换、无缝交联和深度应用等特征的层级、地域、系统...通过对海量、动态、高增长、多元化、多样化司法数据资源的高速处理,可快速获得有价值信息,有效支持人民群众创造美好生活,有效支持优化完善社会治理架构和模式,提高公共决策能力。...《人民法院司法改革成效数据分析报告》,通过定量化分析显示,全国法院院庭长人均办案量司法体制改革全面推开后逐年增长,2016年院庭长人均办案量较2015年增长28.64%,2017年1至9月院庭长人均办案量较...同时,通过选取东、、西部第一、二、三批部分改革试点地区,就其改革前后年人均结案量、审理周期等质效评估数据变化情况进行统计分析发现,改革后全国法院年人均结案数均有大幅增长,改革后年案件平均审理周期缩短,...服务社会治理方面,结合国家发展战略、政策法规和社会大众生活情况,对相关案件变化动态及发展趋势进行深度关联分析,为社会治理提供了预警、预测和评估支持。

1K00
您找到你想要的搜索结果了吗?
是的
没有找到

【案例】恒丰银行——基于大数据技术的数据仓库应用建设

2016年5月企业数据仓库公共数据集市成果基础上,结合大数据技术服务能力,升级改造原有的渠道、授信管理、审计、客户管理等系统,客户服务、风险管理、内部管控、营销管理等多个业务领域开发基于大数据平台的创新...,极低成本快速实现企业应用之间数据的共享与融合,减少数据系统复制导致的数据批处理时延,减少多个应用数据库独立部署带来冗余的数据存储成本。...主题模型领域,根据主题+业务方式进行数据存储,以具体业务为依据提练主题要素,涵盖客户、事件、产品、作业、财务绩效、资产管理、市场与公共元信息(如费率、利率与汇率)。...数据质量管理:通过组件化的脚本对多数据源数据进行数据质量检查,将存在数据结构、字段分隔符、记录换行符、数据编码格式等问题的脏数据入库前过滤出来,并通过数据入库稽核的方式,将不符合表结构定义的脏数据单独输出到脏数据记录表...’”综合能力排名位列全国性商业银行第7位,全国性股份制商业银行前三。

3.1K50

YH7:Oracle Global Data Services知识库

4 Global Services与GDS 数据库服务/服务是用于管理Oracle数据库的工作负载的逻辑抽象体。 每个服务表示具有公共属性,服务级别阈值和优先级的工作负载。...服务内置Oracle数据库,并为工作负载提供单个系统映像。 服务使管理员能够配置工作负载,管理工作负载,启用和禁用工作负载,并将工作负载测量为单个实体。 客户端使用数据库服务名连接。...随着全局数据服务的出现,Oracle客户现在可以使用单个框架统一复制数据库的资源,从而避免需要本地或第三方集成进行负载平衡。 客户可以最小化其整体高可用性/灾难恢复堆栈的供应商集成接触点。...下图描绘了GDS配置本地和远程的复制数据库上运行的电子商务应用的示例配置。 订单输入服务主数据库上运行。 报告服务两个复制数据库之间进行负载平衡。 ?...复制数据库故障后,GDS可以将报告服务故障转移到另一个可用数据库(本示例为主/主服务器),然后与本地复制数据库上运行的报告服务进行负载平衡。

1.3K70

美团外卖离线数仓建设实践

本文主要介绍美团外卖离线数仓的历史发展历程,发展过程碰到的痛点问题,以及针对痛点做的一系列优化解决方案。 01 业务介绍 ?...这里主要介绍外卖数据组整个业务角色。...集团数据:包含集团业务数据、集团公共数据,特点是数据安全要求高。目前公司建立了统一的安全仓,用于存储 BU 的数据,同时定义权限申请流程。...主要过程是获取所需数据组件,进行数据裁剪,与维表关联后冗余维度属性,按需进行上卷聚合、复合指标的计算,最终把获取到的多个小模型拼接起来构建数据应用 通过整套工具的使得数据组件越来越完善,应用建模越来越简单...事:包括敏感 SQL 的预警与拦截,针对敏感 SQL 我们进行拦截并由数据安全人员进行审批 事后:包括敏感 SQL 审计,操作异常审计。

1.3K20

数据治理领域最容易混淆的16组术语概念辨析

术语的作用就是统一术语概念的语境,保证人们在给定语境能够使用专门的语言进行精确的交流。术语概念只使用一个最贴切的业务术语表述,避免使用多个近义词引起歧义。...数据通过分层与水平解耦,经过汇聚、存储、整合、分析、加工,沉淀公共的数据能力,再经过服务封装,形成通用的调用接口,为前端应用提供数据服务调用,支撑前端应用敏捷迭代和快速构建。...2、数据标签:是一种用来描述业务实体特征的数据形式。通过标签对业务实体进行刻画,从多角度反映业务实体的特征。比如对用户进行刻画时,包括性别、年龄、地区、兴趣爱好、产品偏好等角度。...日常工作,经常碰到的业务实体包括用户、商品、商户等,相应的标签分别称之为用户标签、商品标签和商户标签。...4、数据服务:是指通过对企业内外部数据的统一加工和分析,结合不同需求方的需要,以数据分析结果的形式对外提供领域、跨行业的数据服务

1.2K20

“氢元数据”:提供一站式大数据API,可按需定制

“氢元数据”定位于基础数据服务商。开发服务的先行者,平台是以自有数据为基础,通过各种便捷服务整合及第三方数据接入,为互联网开发全行业提供标准化API技术支撑服务平台。...公司提供的产品包括以下四项: 数据源API:独有数据采集模式,爬虫实时动态采集互联网大数据。深度整合互联网数据资源,全面挖掘数据的应用价值,自有数据规模超过2000TB。...全面的互联网大数据爬虫工具、多个大数据分析引擎等,从海量信息通过情感倾向、实体、分类、聚类等多种维度帮助客户分析海量非结构化文本,最大化数据的商业价值。...对领域内所有数据源进行整合、分析、业务建模与可视化,形成完善的大数据应用产品,从而获得新的商业见解。涵盖口碑分析、社会化营销、广告价值分析等多个大数据应用产品。...第三方API集市:专注数据的界应用,为数据需求方、数据提供方、数据服务方等提供多种合作方式。

91590

「深度解析」告诉你如何选择容器存储

高性能计算:当这些应用程序部署容器时,可以使用容器编排来调度它们的多个实例,以便主机集群并行处理任务。...选择存储之前,需要回答以下问题: 应用程序将使用集群架构吗? 应用程序集群将使用复制或共享存储进行数据同步吗? 应用程序使用什么数据格式? 应用程序是否需要高级数据服务?...容器化的应用程序使命令(如打开、关闭、创建和删除)与存储进行通信。 高级的数据服务 在生产环境,一些企业应用程序需要高级数据服务,比如加密、快照、备份和DR。...随着有状态应用程序的容器化,一些应用可能需要重新设计数据服务。例如,可能要求能够集群备份和恢复该容器的存储卷。公共云中,可能需要跨区域复制,或者将存储卷备份到云服务的对象存储服务。...等进行检索、过滤、排序等。

1.2K51

.Net桌面系统架构设计

Shell From和Module模块直接松耦合,模块根据目录或配置文件动态实现装置。 根据业务需要,系统平台应用程序由多个Module(DLLs)组合而成。...领域服务 主要是向外界提供访问业务组件的入口点,它作为一种服务存在 业务实体对象用于代表真实世界的对象,一般使用数据结构来表示、XML流或者是用户自定义的面向对象的类,业务实体用来各层之间以及各组件之间进行通信和传递数据...本层还提供Data Adapter/Converter功能,可以把层基础组件定义的Data Contract对象转换为领域服务层Domain对象。...支持用户使用Plug In插件的方式扩展数据服务层功能,用户可以根据需要实现自己个性化数据服务接口,来实现为平台提供用户数据 开发平台架构优势 1.提供一个针对企业级智能客户端应用的公共开发体系结构,提供成熟的模块化方案...,支持模块化应用程序开发,允许构建由各个具有协作关系的独立模块组合成的复杂应用,并且在运行时对各个模块进行动态管理,使系统可以拆分成多个部分来对立开发,适合较大项目多个团队合作开发,方便整合。

1.6K33

减了 1.5 分。。。1450 万大单没了。。。

项目规模:本项目以公安信息网上的公共视频结构化数据为依托,综合分析公安已有各类数据,挖掘治理视频数据,支持层级,跨部门、警种实现多类型视频图像智能应用,提供实时监控、智能分析、高效处置、预测预警、动态管控和精准服务...本项目包含公安信息网内的建设内容及公安视频专网转发模块,主要建设内容包括:公安信息网内的平台服务层、数据服务层、智能应用层以及公安视频专网转发模块内的平台服务层、数据服务层。...重点将通过公安视频专网转发模块推送来的数据、公安信息网(包括检查站、看守所等)产生的结构化及非结构化数据、公安业务系统提供的结构化数据整合,开展视频图像智能应用,为相关部门和公安机关提供数据服务和支撑。...中标候选人变更公示 2021年9月23日中标候选人变更公示发布,项目于9月17日雄安新区公共资源交易中心经原评标委员会成员复议后公示内容变更为:移系统集成有限公司 1581 万元中标。...中国电信集团系统集成有限责任公司河北分公司评分由 93.13 改为了 91.63,低于移集成的 91.93,变更为第二标候选人,落标。

18520

EasyExcel实现动态列解析和存表

背景一个表的数据来源于多个其他系统的导出表,其中的特点就是大多数的字段都是一样的(可能导出的表头不一样),只有部分少数字段是每个系统自己独有的。...总结:公共字段(翻译表头:@ExcelProperty 可以指定多个表头( @ExcelProperty(value = {"发货数量", "采购数量(台)"}) ))动态字段(需要有每个系统内动态字段的字段名称和表头的对应关系...,考虑使用字典,供业务员配置,后续如果新添加其他动态字段直接在字典配置,无需另行开发)注意:由于无法控制和预料固定字段新接入的系统的实际表头,所以如果新接入系统的公共表头与表字段不一致,需要在 @...continue; } commonFieldList.add(field.getName()); } //过滤实体公共字段...总结本文介绍了使用 EasyExcel 组件来进行导入,实现公共列和动态列组合类型的导入,以及如何存储的功能,主要利用反射和字典分别来维护公共列和动态列的表头和字段的对应关系,利用此关系对数据进行解析。

4.6K31

边缘服务的一致性、耦合和复杂性

RESTful API 设计,URI 的路径部分用于标识特定实体 (也称为资源)。HTTP 谓词用于标识要对实体执行的操作类型。实体可以通过其他实体的 URI 路径部分链接到其他实体。...例如,我不想在规划旅行行程时打开多个页面,我希望在下订单之前能够一个页面上看到所有的摘要信息 (包括航班、汽车租赁和酒店预订)。...Apollo GraphQL 框架支持 schema 中使用缓存提示注解或在解析器动态设置,这可以通过浏览器端缓存或内存缓存或外部缓存 (如 Memcached 或 Redis) 来实现。...如果你知道在哪里可以找到某个功能的实现代码,你很快就会知道该如何去阅读它的代码(很可能会多个代码库)。...但后续需要马上跟进(需要各方的参与),进行长期必要的重构工作,让系统重新具备清晰的关注点分离,并从整体上降低意外复杂性。这就是技术负债给我们带来的教训。 如果可能的话,降低组件的耦合性。

91910

台战略全解读(三):业务台建设

划分出多个主题域后,技术架构师需要结合技术的实现,将领域进行组合规划出中心。中心的划分标准主要从实体的聚合度、中心的职责、中心颗粒度、能否独立运营等方面来权衡。确定中心的过程也就是划定功能边界的过程。...同时微服务架构也带来了复杂性,一个微服务应用一般由多个服务组成,每个服务又有多个实例,因此一套台系统部署上线后,至少有几十个节点提供服务。...分布式事务 分布式事务技术(DTP)用于保证多个资源事务的一致性,目前 X/Open XA 标准已由众多厂家实现来支持分布式事务。...DTP 模型的典型应用场景是两阶段提交协议,多个资源管理器(RM)由一个事务管理器(TM)进行管理,事务管理器控制着全局事务和分支事务。...应用场景涉及的系统和步骤不是特别多的情况下,GTS 可以方便快速地实现分布式事务。 扩展点机制 业务台自身提供了很多配置化功能,支持灵活快速地对业务功能进行扩展。

1.3K20

业务台设计八大原则与分布式运行机制

划分出多个主题域后,技术架构师需要结合技术的实现,将领域进行组合规划出中心。中心的划分标准主要从实体的聚合度、中心的职责、中心颗粒度、能否独立运营等方面来权衡。确定中心的过程也就是划定功能边界的过程。...二、分布式运行机制 台采用微服务风格进行建设,每一个业务中心都是独立部署的,因此分布式运行机制是保障业务台正常运行的基础。...同时微服务架构也带来了复杂性,一个微服务应用一般由多个服务组成,每个服务又有多个实例,因此一套台系统部署上线后,至少有几十个节点提供服务。...6.分布式事务 分布式事务技术(DTP)用于保证多个资源事务的一致性,目前 X/Open XA 标准已由众多厂家实现来支持分布式事务。...DTP 模型的典型应用场景是两阶段提交协议,多个资源管理器(RM)由一个事务管理器(TM)进行管理,事务管理器控制着全局事务和分支事务。

63510

走进大数据应用!!——电商实战

尽管电商市场的规模不断扩大,但淘汰率仍很高,竞争十分激烈。   二、大数据如何应用于电商市场  大数据我国已广泛应用在电子商务平台的推荐引擎、金融行业的风险控制等多个领域。...分析引擎可以作为一家电商平台的“诊断环节”,通过后台数据的获取,如漏斗模型所示,电商将了解用户购物的不同环节的逃离率,从而更直观地了解应该在哪一环节进行优化。...而这一技术早在1998年,就被24岁的华盛顿大学在读博士格雷格林登申请了著名专利“Item-to-Item”协同过滤技术,并很快应用在Amazon上。如今,电商推荐技术美国已得到了广泛应用。...网购迷对推荐引擎并不陌生:当我们点入某电商平台主页,醒目位置通常是“猜你喜欢”这一环节;通常购买之后平台还会继续为你推荐产品……   四、电商平台大数据应用效果几何  推荐引擎可以平台、浏览器,甚至设备地获取电商中用户的偏好并即时反映到推荐栏目中...麦肯锡的大数据报告,列举了大数据5 个行业已产生的千亿美元的经济价值。公共事业的交通管理方面,通过电子收费站等方式对路面车流量进行监控,并可以对路面的潜在拥堵进行预测,有效减少交通拥堵的状况。

1.3K60

云存储是如何工作的?

云存储通过使用高度虚拟化的基础设施为企业提供可扩展的存储资源,可以按照预定义的方式进行配置,也可以根据组织的要求动态配置。...基于云计算的存储具有多个独特属性,使其对于尝试在当今数据密集型业务环境竞争的企业具有吸引力。...例如: •分配资源以实现动态弹性和可用性 •复制资源以实现灾难恢复和容错 •数据复制最终是一致的,以确保可用性 云存储可以企业内部进行管理,但它是远程托管的第三方平台,可以为当今的企业提供最大的利益。...云存储涉及用户通过互联网连接的一个或多个数据服务器。用户通过全球互联网以人工或自动方式将文件发送到数据服务器,数据服务器将信息转发到多个服务器。然后,可以通过基于Web界面访问存储的数据。...关注安全性的企业可能更喜欢管理自己的云存储系统架构,而不是使用公共云。 (3)公共云存储 公共云存储可从第三方作为服务获得。亚马逊AWS云存储、微软Azure云存储和谷歌云存储往往企业很受欢迎。

3.6K10

CDP平台赋能精细化运营实践

实时触达:在用户行为路径,增加触点交互,提升用户交互体验,并促进用户转化。例如用户浏览多个商品都没有下单时,弹出优惠券刺激下单转化。...火车票订单、酒店订单、红包卡券数据 标签生产: 按照场景人群逻辑,清洗加工标签 人群圈选: 以标签为限定条件,从全量用户过滤圈选出目标人群 用户触达: 将用户数据传输到营销通道,对用户进行触达 效果评估...CDP定位是服务于全集团,除了公共的数据标签外,需要支持不同业务条线基于自身业务属性参与标签共建,标签目录及元数据公开,申请权限后方可进行人群圈选。...以实时交叉营销场景为例,用户进入小程序后,实时判断用户是否有待出行订单,订单业务线(火车还是飞机还是汽车),不同出行方式用户推荐酒店产品和优惠券时,文案和优惠金额是差异化的,这个业务过程涉及到多个人群...(2)标签丰富扩展方便 CDP实现了域、系统的数据汇聚,加上标签的配置化生产,可以快速地上线一个标签需求。

1.3K20

主数据与数据

回答1 对主数据的解释 主数据是描述核心业务实体(如客户、供应商、地点、产品和库存)的一个或多个属性。所以主数据即是进行企业业务架构分析中发现的核心业务对象。...数据台是实现业务台核心共享数据的域整合,再通过加工后提供整合后的数据服务能力。...原来主数据系统可能存在提供某类主数据全局视图的数据服务能力,或者存在涉及查询多个主数据对象后的整合数据服务能力,该部分能力新架构中转移到数据台中的数据服务能力开放来提供,如上图红线部分。...我认为主数据是组织需要跨业务、跨部门、系统共享的核心业务实体数据,是企业的核心数据,这些数据由于应用广泛,必须严格保证其唯一性、一致性、准确性、实时性。...而主数据的存在就是把企业的多个业务系统中最核心的、最需要共享的数据(主数据)进行整合,集中进行数据的清洗和标准化。

53410

数据治理平台工具前世今生

很多大型集团企业开始采用开源技术独立开发数据治理工具, 采用微服务架构,满足MES、PLM等多个层面数据共享需求, 内容扩展增加了动态建模、移动应用,生产层面的主数据、数据指标、多语言等功能。...)以及数据实体加工处理过程的逻辑; 2)元数据管理:实现元数据的模型定义并存储,功能层包装成各类元数据功能,最终对外提供应用及展现;提供元数据分类和建模、血缘关系和影响分析,方便数据的跟踪和回溯。...1)主数据存储、整合:实现主数据整合、清洗、校验、合并等功能,根据企业主数据标准和业务规则和主数据质量标准对收集到的主数据进行加工和处理,用于提取分散各个支撑系统的主数据集中到主数据存储库,合并和维护唯一...3.9 数据安全工具 数据安全管理的目标是建立完善的体系化的安全策略措施,全方位进行安全管控,通过多种手段确保数据资产“存、管、用”等各个环节的安全,做到“事前可管、事可控、事后可查”。...微服务架构下数据服务架构图 4.2 网段的数据交换能力 基于统一的数据交换服务实现了端对端的数据交换。通过事务处理机制保证交换的数据一致性。

4.8K78

SIGIR22 推荐系统论文之对比学习篇

此外,我们利用来自知识图谱增强过程的额外监督信号来指导视图对比学习范式,梯度下降为无偏的用户-商品交互提供更大的权重,并进一步抑制噪声。...在三个公共数据集上进行的大量实验证明了我们的 KGCL 始终优于最先进的技术。KGCL 具有稀疏用户-商品交互、长尾和嘈杂的知识图谱实体的推荐场景也取得了强大的性能。...各种协同过滤技术,基于 GNN 的推荐系统 (例如 PinSage 和 LightGCN)的开发提供了最先进的性能。...受最近对比学习成功从数据本身挖掘监督信号的启发,本文中,我们专注于探索知识图谱感知推荐的对比学习,并提出了一种新颖的多级视图对比学习机制,命名为MCCLK。...因此,本文中,我们提出提取对比多兴趣并设计微视频推荐模型 CMI。具体来说,CMI 从每个用户的历史交互序列中学习多个兴趣嵌入,其中隐式正交微视频类别用于解耦多个用户兴趣。

1.6K20
领券