章鱼carl的专栏

从部署到实践，即刻拥有你的专属龙虾助手

OpenClaw开发者专区🦞🦞🦞

自行/邀约他人一键搬运博客，享价值百万资源包

腾讯云自媒体同步曝光计划

往期视频·干货材料·成员作品 最新动态

腾讯技术创作特训营知识专栏

新邀入驻腾讯云开发者社区，福利多多！

一般也不需要非常仔细地进行数据分层，数据直接通过Flink计算或者聚合之后将结果写MySQL/ES/HBASE/Druid/Kudu等，直接提供应用查询或者多维分析。

实时数仓一般性总结

数据越冗余越难保证数据一致性，分布式存储就是这样，但是维度退化到事实表后相当于预聚合了，所以查询分析效率高。

数仓一般性总结

分布式系统解决的主要矛盾是单机单节点的瓶颈问题。例如，性能和可用性。技术演进所使用的基本思想是分治和多副本。衍生出数据多副本，任务多副本，并行计算，移动计算，数据本地性等等。衍生的架构主要有主备架构，主从架构，无主对等架构。带来的新的矛盾是CAP定理中所阐述的在三个维度之间的平衡。技术难点主要体现在分布式数据一致性，分布式事务协调。例如，主备节点之间的数据一致性与可用性的平衡，分布式集群选主过程中的协调。衍生出的算法有Quorum，Paxos，Raft，ZAB，Lease等等。其他的衍生技术，例如，数据投递的三种一致性语义（精确一次、至少一次、至多一次），数据分区的四种常见方式（hash、等量、特征字段范围、一致性hash），日志的两种策略（全量、增量）。

分布式一般性总结

1. Disruptor：Apache Storm底层应用了Disruptor来实现worker内部的线程通信；


线程框架模型总结

本文主要聊一聊笔者对软件工程、系统设计、OOA/OOD/OOP、面向对象设计原则、设计模式等概念的简单理解。这些都是高度抽象化，同时又很重要的概念。笔者仅是一个毕业工作五年的研究生，必然存在较大的认知局限。文中同时也借用了许多专家的精彩段落来帮助笔者阐述，引用会贴在段末。

浅谈面向对象的那些形而上

线程模型能帮助我们更深刻的理解Flink任务执行原理，更精确的控制Flink程序，这些是使用Flink解决复杂问题、写出高性能和高可用程序的基础。

【Flink】第三十三篇： 任务线程模型

从【Flink】第二十七篇：三天撸了一个 Flink SQL 字段血缘算法 这篇文章开始，笔者开启了一个Flink SQL字段血缘实现的探索之路。但是由于当时只是针对Flink 运行时中产生的calcitetree简单分析后写出的简易版，有诸多不成熟之处，所以也没说过多的实现细节。

【Flink】第三十二篇：Flink SQL 字段血缘中树的构建与遍历

上一篇【Flink】第三十篇：Netty 之 Java NIO 为大家分享了IO 中的基本概念、5种 IO 模型、IO多路复用、Reactor IO设计模式。

【Flink】第三十一篇：Netty 之 核心设计、核心抽象和线程模型

从本篇开始回顾总结Netty通信框架，尝试为读者揭开它的神秘面纱。Flink内部节点之间的通信是用Akka，比如JobManager和TaskManager之间的通信。而operator之间的数据传输是利用Netty。

【Flink】第三十篇：Netty 之 Java NIO

【Flink】第四篇：【迷思】对update语义拆解D-、I+后造成update原子性丢失

【Flink】第二十九篇：源码分析 Blink Planner

【Flink】第二十八篇：Flink SQL 与 Apache Calcite

【Flink】第二十七篇：三天撸了一个 Flink SQL 字段血缘算法

【Flink】第二十六篇：源码角度分析Task执行过程

【Flink】第二十五篇：源码角度分析作业提交逻辑

【Flink】第四篇：【迷思】对update语义拆解D-、I+后造成update原子性丢失


【Flink】第二十四篇：源码角度分析 DataStream API 调用逻辑

继以上 Flink Join 两篇文章之后探讨最后一类Flink的Join：temporal join。


【Flink】第二十三篇：join 之 temporal join

【Flink】第四篇：【迷思】对update语义拆解D-、I+后造成update原子性丢失
【Flink】第五篇：checkpoint【1】
【Flink】第五篇：checkpoint【2】
【Flink】第八篇：Flink 内存管理
【Flink】第九篇：Flink SQL 性能优化实战
【Flink】第十篇：join 之 regular join
【Flink】第十三篇：JVM思维导图
【Flink】第十四篇：LSM-Tree一般性总结
【Flink】第十五篇：Redis Connector 数据保序思

【Flink】第二十二篇：一文终结 Flink 内存配置

Flink的内存管理是基于JVM内存模型的，所以，在内存调优或者解决各种OOM等问题时JVM内存管理是绕不开的话题。本文以Direct Memory为切入点，探索堆外内存、直接内存、以及他们在Java NIO源码中如何体现的。最后，简单介绍Java NIO的零拷贝在Kafka和Netty中的应用。

【Flink】第十八篇：Direct Memory 一箩筐


HBase的设计思想主要是LSM。参见【Flink】第十四篇：LSM-Tree一般性总结。而LSM存储引擎的主要设计思想就是不断的将内存的有序存储结构flush到磁盘，这时候会在磁盘形成一个个的小的文件，如果每次都去做新文件和旧文件的合并，这显然是没必要，并且低效的。

【Flink】第二十一篇：HBase 写热点问题实战

经过测试环境的基本验证后，在线上试跑我们的Flink SQL批量从Hive抽数到HBase程序，出现了GC时间超阈值的警告，


【Flink】第二十篇：HBase GC 调优实战

文章

问答

视频

教程

学习中心

腾讯云实验室

直播

竞赛

腾讯云代码分析专区

腾讯iOA零信任安全管理系统专区

腾讯云架构师技术同盟交流圈

腾讯云数据库专区

腾讯云智能顾问专区

腾讯云原生专区

腾讯混元专区

腾讯云TCE专区

腾讯云Lighthouse专区

腾讯云HAI专区

腾讯云Edgeone专区

腾讯云存储专区

腾讯云智能专区

腾讯轻联专区 

腾讯云开发专区

TAPD专区

腾讯轻量云游戏服专区

EdgeOne AI 安全实战专区

腾讯云最具价值专家

腾讯云架构师技术同盟

腾讯云创作之星

腾讯云开发者先锋

腾讯云代码助手

云原生构建

TAPD 敏捷项目管理

Cloud Studio

SDK中心

API中心

命令行工具

涵盖代码开发、场景应用、自动测试全流程，助你从零构建专属AI助手

一站式MCP教程库，解锁AI应用新玩法

聚焦“写作效率、视觉美观与运行性能”三方面进行全面升级，为您提供更高效、稳定的创作环境

社区富文本&Markdown编辑器全新改版上线，欢迎大家体验!

诚挚邀请您参与本次调研，分享您的真实使用感受与建议。您的反馈至关重要，感谢您的支持与参与！

社区新版编辑器体验调研

腾讯云开发者社区推出了章鱼carl的专栏专栏，为你提供了章鱼carl的专栏的相关文章，致力于帮助开发者快速成长与发展。

章鱼carl的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐