首页
学习
活动
专区
工具
TVP
发布

chaplinthink的专栏

专栏作者
47
文章
40623
阅读量
12
订阅数
[译]使用Python和Dash 创建一个仪表盘(上)
在数据科学和分析的领域,数据能力的释放不仅是通过提取见解的方式, 同时也要能通过有效的方式来传达见解.这就是数据可视化发挥见解的地方.
awwewwbbb
2023-10-16
3820
数据仓库
海盗指标法(AARRR海盗模型) 它反映了增长是系统性地贯穿于用户生命周期各个阶段的:用户拉新(Acquisition)、用户激活(Activation)、用户留存(Retention)、商业变现(Revenue)、用户推荐(Referral)
awwewwbbb
2023-10-16
1610
logback.xml详解
之前博文有专门介绍过基于Log4j Appender 实现大数据平台组件日志的采集, 本篇主要对java项目中经常会接触到的logback.xml文件的配置做一个介绍和总结.
awwewwbbb
2022-10-28
5930
Rust学习入门
高性能,内存利用率高,没有运行时和垃圾回收 可靠 , 丰富的类型系统和所有权模型保证内存和线程安全,编译器可以消除各种错误 生产力, 包管理器、构建工具一流, 多编辑器支持自动补齐和格式化代码
awwewwbbb
2022-10-05
3080
Hive一次更新多个分区数据方案
场景 订单数据之类的业务表,因为有状态要更新,比如订单状态,物流状态之类的,需要同步很久之前的数据到Hive. 如何同步时在Hive中进行操作一次更新多个分区内的数据? Hive 操作 设置Hive动
awwewwbbb
2022-09-16
7950
Flink window
我们经常需要在一个时间窗口维度上对数据进行聚合,窗口是流处理应用中经常需要解决的问题。Flink的窗口算子为我们提供了方便易用的API,我们可以将数据流切分成一个个窗口,对窗口内的数据进行处理
awwewwbbb
2022-05-30
1.6K0
Flink on Yarn和k8s
Session 模式和 Per Job 模式的应用场景不一样。Per Job 模式比较适合那种对启动时间不敏感,运行时间较长的任务。
awwewwbbb
2022-05-29
1.4K0
Flink如何处理update数据
只要source端产生了changelog数据,后面的算子是可以自动处理update消息的,简单理解,你可以认为:
awwewwbbb
2022-05-26
1.8K0
Flink Catalog
Catalog 提供了元数据信息,例如数据库、表、分区、视图以及数据库或其他外部系统中存储的函数和信息。
awwewwbbb
2022-05-19
7350
Flink checkpoint
Checkpoint是Flink实现容错机制最核心的功能,能够根据配置周期性地基于Stream中各个Operator的状态来生成Snapshot,从而将这些状态数据定期持久化存储下来,从而将这些状态数据定期持久化存储下来,当Flink程序一旦意外崩溃时,重新运行程序时可以有选择地从这些Snapshot进行恢复,从而修正因为故障带来的程序数据状态中断。
awwewwbbb
2022-05-19
5980
Flink 状态编程
在程序计算过程中,在Flink程序内部存储计算产生的中间结果,并提供给后续Function或算子计算结果使用。(如下图所示)
awwewwbbb
2022-05-17
6790
Flink Time
一个watermark 代表了 watermark所包含的timestamp 数值,表示后来的数据已经再也没有小于或等于这个时间的了.
awwewwbbb
2022-05-15
2820
Flink DataStream API
DataStream API主要可为分为三个部分,DataSource模块、Transformation模块以及DataSink模块。
awwewwbbb
2022-05-14
3890
ClickHouse-查询优化
Prewhere 和 where 语句的作用相同,用来过滤数据。不同之处在于 prewhere 只支持*MergeTree 族系列引擎的表,首先会读取指定的列数据,来判断数据过滤,等待数据过滤之后再读取 select 声明的列字段来补全其余属性。 当查询列明显多于筛选列时使用 Prewhere 可十倍提升查询性能,Prewhere 会自动优化执行过滤阶段的数据读取方式,降低 io 操作。 在某些场合下,prewhere 语句比 where 语句处理的数据量更少性能更高
awwewwbbb
2022-05-12
5380
Clickhouse副本及分片
副本的目的主要是保障数据的高可用性,即使一台 ClickHouse 节点宕机,那么也可以从其他服务器获得相同的数据
awwewwbbb
2022-05-11
9920
Clickhouse SQL语法
ClickHouse 提供了 Delete 和 Update 的能力,这类操作被为 Mutation 查询,它可以看做 Alter 的一种。 虽然可以实现修改和删除,但是和一般的 OLTP 数据库不样,Mutation 语句是一种很“重”的操作,而且不支持事务。 “重”的原因主要是每次修改或者删除都会导致放弃目标数据原有分区,重建新分区。所以尽量做批量的变更,不要进行频繁小数据的操作
awwewwbbb
2022-05-11
7780
Clickhouse入门及实践
表引擎决定了如何存储表的数据。表引擎的使用方式就是必须显式在创建表时定义该表使用的引擎,以及引擎使用的相关参数
awwewwbbb
2022-05-10
7480
Flink CDC 与Hudi整合
之前写过Flink CDC sink 到 Iceberg中,本篇主要实践如何CDC到hudi中.
awwewwbbb
2022-05-09
9780
Flink CDC同步MySQL分库分表数据到Iceberg数据湖实践
Flink CDC: 捕获数据库完整的变更日志记录增、删、改等所有数据. Flink在1.11版本开始引入了Flink CDC功能,并且同时支持Table & SQL两种形式。Flink SQL CDC是以SQL的形式编写实时任务,并对CDC数据进行实时解析同步。相比于传统的数据同步方案,该方案在实时性、易用性等方面有了极大的改善。
awwewwbbb
2022-04-27
2.3K1
介绍
下面主要从架构、组件原理、业务场景等角度针对相关组件的技术要点进行总结. 主要以问题驱动.
awwewwbbb
2022-04-27
8850
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档