首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
首页标签数据湖

#数据湖

数据湖是一个集中式存储池,可对接多种数据源,无缝对接各种计算分析和机器学习平台

对数据湖概念及其应用场景若干问题的思考

人月聊IT

这三个方面可以理解为数据湖的核心能力,其它的类似数据清洗转化,数据治理,数据质量管理等都是扩展能力,不是数据湖的核心。同时我个人实际是比较反对将这些能力全部加到...

7210

从前车马很慢,现在湖仓很快,一个Doris够用一辈子

一臻数据

于是我们有了数据仓库——把数据清洗、建模、优化,专门用来做分析。性能飞跃,查询秒级响应。

4700

StarRocks x Iceberg:云原生湖仓分析技术揭秘与最佳实践

StarRocks

Lakehouse 湖仓一体架构是一种融合数据湖与数据仓库优势的新型架构,既具备数据湖开放统一的存储能力(支持多源异构数据低成本存储),又拥有数据仓库的高性能分...

12610

大数据知识总结(六):数据湖重要原理架构

Lansonli

数据湖是一个集中式的存储库,允许你以任意规模存储多个来源、所有结构化和非结构化数据,可以按照原样存储数据,无需对数据进行结构化处理,并运行不同类型的分析对数据进...

19010

预告 | 腾讯云存储将亮相中国系统架构师大会·北京站

云存储

腾讯云 | 云存储 (已认证)

2025年5月23-24日中国系统架构师大会-专题研讨会·北京站,将在北京·朗丽兹西山花园酒店召开。本届大会以“数智赋能 架构演进”为主题,搭建一个高端、开放、...

12010

数据湖迈向 Data+AI 一体化平台的演进之路

腾讯QQ大数据

本文将围绕国内市场现状,探讨如何推动数据湖从传统的 Data 模式进入到 Data+AI 一体化平台这一方向。主要内容包括:

27810

快速搞懂湖仓一体的发展历程:错过它,你将失去下一个大数据风口!

shengjk1

为了解决数据湖在分析方面的复杂性,数据湖表格式(Data Lake Table Formats)应运而生。这些表格式是专门为数据湖设计的存储格式,旨在优化数据的...

10700

数据湖出现的背景、现状与未来

shengjk1

数据湖(Data Lake)的概念随着大数据技术的发展而逐渐兴起。传统数据仓库(Data Warehouse)在数据存储和处理方面存在一定的局限性,例如数据需要...

8900

2025 年 4 月 Apache Hudi 社区新闻

ApacheHudi

欢迎阅读由 Onehouse.ai1 为您带来的2025年4月版Hudi通讯!本月,我们将为您带来另一轮令人兴奋的社区更新、技术深度探讨以及展示Apache H...

8310

Uptycs: 构建快如闪电的分析

ApacheHudi

在 Uptycs,我们的数据平台架构多年来随着几乎所有数据平台的自然发展而发展。最初我们的架构围绕在线事务处理 (OLTP) 数据库 (在我们的例子中主要是 P...

9600

不用一行代码,也能开发数据 API —— QuickAPI,让数据调用更简单

用户7709826

在当今数据驱动的时代,企业和开发者都希望能快速、高效地构建数据 API,以便将数据库中的数据灵活应用于各种业务场景。但传统的 API 开发往往涉及复杂的编码、繁...

18300

深度好文:三大主流数据湖格式Hudi、Iceberg、Delta Lake的数据聚类技术对比详解

用户9421738

聚类是数据湖仓架构中的一项关键优化技术,它解决了数据布局与查询访问模式对齐的挑战。通过线性排序和多维聚类等策略,可以少不必要的文件扫描来显著提高查询性能。

25310

Apache Hudi深度揭秘:记录级元数据字段的价值与存储成本

用户9421738

Apache Hudi最初由Uber于2016年开发,旨在构建一个事务型数据湖,以快速可靠地处理数据更新,支持其网约车平台的高速增长。如今,Hudi已被行业广泛...

15510

国内首场Iceberg Meetup!腾讯云推出TC-Iceberg开放智能数据湖方案

腾讯QQ大数据

国内首场 Apache Iceberg Meetup 在深圳成功举办,腾讯云在活动中分享了 Iceberg 在腾讯云大数据中的成功实践,并推出了 TC-Iceb...

22310

Iceberg表格式

Yiwenwu

腾讯 | 后台开发工程师 (已认证)

Iceberg是介于上层计算引擎与底层存储格式之间的中间层,定义为一种"数据组织格式"并称为表格式,它并不定义数据存储方式,而是定义了数据、元数据的组织方式,向...

20610

抖音集团数据湖表优化与管理实践

ApacheHudi

抖音集团内部使用的数据湖格式称为 ByteLake,它是基于 Apache Hudi 深度定制的一个数据库框架,其核心功能包括支持 ACID、增量消费更新和湖仓...

13701

相关产品

  • 数据湖

    数据湖是一个集中式存储池,可对接多种数据源,无缝对接各种计算分析和机器学习平台

领券