大数据学习与分享

从部署到实践，即刻拥有你的专属龙虾助手

OpenClaw开发者专区🦞🦞🦞

自行/邀约他人一键搬运博客，享价值百万资源包

腾讯云自媒体同步曝光计划

往期视频·干货材料·成员作品 最新动态

腾讯技术创作特训营知识专栏

新邀入驻腾讯云开发者社区，福利多多！

【摘要】“数据编织”一词高频出现，似乎已经进入落地阶段，本文介绍了数据编织产生的背景及其定义，详细分析了数据编织与数据中台、数据治理、DataOps的关系，以及未来数据编织发展的方向和需要关注的问题。

数据编织与数据中台、数据湖、数据治理、DataOps的关系

系统架构是概念的体现，是对物/信息的功能与形式元素之间的对应情况所做的分配，是对元素之间的关系以及元素同周边环境之间的关系所做的定义。

IT架构图构图模板合集

数据中台是一套可持续“让企业的数据用起来”的机制，是一种战略选择和组织形式，是依据企业特有的业务模式和组织架构，通过有形的产品和实施方法论支撑，构建的一套持续不断把数据变成资产并服务于业务的机制

数据中台知识体系

反向 ETL 是将数据从数据仓库或数据湖移回到操作系统、应用程序或其他数据源的过程。“反向 ETL”一词可能看起来令人困惑，因为传统的 ETL（提取、转换、加载）涉及从源系统提取数据、出于分析目的对其进行转换，然后将其加载到数据仓库或数据湖中。

现代数据技术栈：反向ETL

数据仓库的建设的最重要的核心核心之一就是数仓模型的设计和构建，这个决定了数仓的复用和性能，本文将介绍四种建模的理论：维度建模、关系建模、Data Vault建模、Anchor模型建模，文后也介绍几种常见的数仓建模工具。


深入讲解四种数仓建模理论方法

    ClickHouse 是Yandex开源的一个用于实时数据分析的基于列存储的数据库，其处理数据的速度比传统方法快100-1000 倍。

一文掌握ClickHouse

用户从 Lambda 架构入手，将数据管道拆分为批处理链路和流处理链路。对于实时数据流，他们应用 Flink CDC ；对于批量导入，他们结合了 Sqoop、Python 和 DataX 来构建自己的数据集成工具，名为 Hisen。

Apache Doris取代ClickHouse、MySQL、Presto和HBase

CDC是（Change Data Capture 变更数据获取）的简称。核心思想是，监测并捕获数据库的变动（包括数据 或 数据表的插入INSERT、更新UPDATE、删除DELETE等），将这些变更按发生的顺序完整记录下来，写入到消息中间件中以供其他服务进行订阅及消费。

Flink-CDC同步MySQL到Hive实践

什么是元数据？元数据MetaData狭义的解释是用来描述数据的数据，广义的来看，除了业务逻辑直接读写处理的那些业务数据，所有其它用来维持整个系统运转所需的信息／数据都可以叫作元数据。比如数据表格的Schema信息，任务的血缘关系，用户和脚本／任务的权限映射关系信息等等。

元数据管理与数据血缘

初次接触数据治理工作的朋友可能都会遇到主数据和数据中台这两个概念，经常有粉丝朋友问我二者有什么区别。


主数据与数据中台

导读：本案例描述的数据仓库建设问题和解决经验，在企业数仓初期建设时多少都会遇到，对制定数仓初期建设方案有一定的参考意义，推荐收藏。

数据仓库建设经验总结

大数据中心建设方案

注意事项：
这里使用的是本地FSstateBackend,注意你的路径的设置，以hdfs://或者file://为地址标识符，否则Flink的文件系统将无法识别。

Flink exactly-once系列实践之KafkaToKafka

信息化是对企业已形成的相关信息的记录和各个环节业务的结果与管控；数字化则是让业务和技术真正产生交互，改变传统的商业运作模式。

信息化和数字化的区别

在大数据时代，规范地进行数据资产管理已成为推动互联网、大数据、人工智能和实体经济深度融合的必要条件。贴近业务属性、兼顾研发各阶段要点的研发规范，可以切实提高研发效率，保障数据研发工作有条不紊地运作。而不完善的研发流程，会降低研发效率，增加成本与风险。

大数据开发流程及规范

本文首先介绍了大数据架构平台的组件架构，让读者了解大数据平台的全貌，然后分别介绍数据集成、存储与计算、分布式调度、查询分析等方面的观点，最后是专家眼里大数据平台架构的发展趋势。

大数据架构平台架构设计和技术分析

企业需要转变对数据资产价值的认知，在企业运营及管理中建立数据资产价值体系。在数字化业务领域中，需要考虑将数据权属定义至指定的部门及岗位，将数据资产的价值纳入到整体运营及考核中，真正做到将数字资产的价值嵌入到每一个数字化流程。

数据治理体系建设与数据资产规划

最近在提交flink项目example下WordCount.jar批处理任务时遇到以下问题：

Flink任务提交问题分析和解决

在Kimball维度建模中，通常将度量称为“事实”，将环境描述为“维度”，维度是用于分析事实所需要的多样环境。维度和维度属性是维度的两个核心概念，如何构建维度的属性是维度设计中需要关注的。维度具有层次结构，维度中的一些描述属性以层次方式或一对多方式相互关联。比如商品维度，有卖家、类目、品牌等父层次。对于层次结构，是采用雪花模式进行规范化处理还是将维度的属性层次合并到单个维度中进行反规范化处理，需要进行取舍。

数据建模-维度建模-维度设计

现有6份数据文件，分别记录了《王者荣耀》中6种位置的英雄相关信息。现要求通过建立一张表t_all_hero，把6份文件同时映射加载。

Hive静态分区、动态分区、多重分区全解析

文章

问答

视频

教程

学习中心

腾讯云实验室

直播

竞赛

腾讯云代码分析专区

腾讯iOA零信任安全管理系统专区

腾讯云架构师技术同盟交流圈

腾讯云数据库专区

腾讯云智能顾问专区

腾讯云原生专区

腾讯混元专区

腾讯云TCE专区

腾讯云Lighthouse专区

腾讯云HAI专区

腾讯云Edgeone专区

腾讯云存储专区

腾讯云智能专区

腾讯轻联专区 

腾讯云开发专区

TAPD专区

腾讯轻量云游戏服专区

EdgeOne AI 安全实战专区

腾讯云最具价值专家

腾讯云架构师技术同盟

腾讯云创作之星

腾讯云开发者先锋

腾讯云代码助手

云原生构建

TAPD 敏捷项目管理

Cloud Studio

SDK中心

API中心

命令行工具

涵盖代码开发、场景应用、自动测试全流程，助你从零构建专属AI助手

一站式MCP教程库，解锁AI应用新玩法

聚焦“写作效率、视觉美观与运行性能”三方面进行全面升级，为您提供更高效、稳定的创作环境

社区富文本&Markdown编辑器全新改版上线，欢迎大家体验!

诚挚邀请您参与本次调研，分享您的真实使用感受与建议。您的反馈至关重要，感谢您的支持与参与！

社区新版编辑器体验调研

腾讯云开发者社区推出了大数据学习与分享专栏，为你提供了大数据学习与分享的相关文章，致力于帮助开发者快速成长与发展。

大数据学习与分享

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐