首页
学习
活动
专区
工具
TVP
发布

HappenLee的技术杂谈

专栏作者
76
文章
92218
阅读量
29
订阅数
Doris开发手记3:利用CoreDump文件快速定位Doris的查询问题
Apache Doris的BE部分是由C++编写,当出现一些内存越界,非法访问的问题时会导致BE进程的Crash。这部分的问题常常较难排查,同时也很难快速定位到对应的触发SQL,给使用者带来较大的困扰。所以下面会介绍通过Linux的CoreDump快速定位到问题SQL,并复现问题的方式。
HappenLee
2021-07-15
1.4K0
ClickHouse源码笔记1:聚合函数的实现
聚合函数: 顾名思义就是对一组数据执行聚合计算并返回结果的函数。 这类函数在数据库之中很常见,如:count, max, min, sum等等。
HappenLee
2020-06-02
2.8K2
AeroSpike踩坑手记1:Architecture of a Real Time Operational DBMS论文导读
从论文的题目出发,这篇文章的核心在于实时操作数据库的架构,在论文引言之中对Aerospike的定位是一个高性能分布式数据库,用于处理实时的交互式在线服务。所以说,大多数使用Aerospike的场景是实时决策系统,它们有海量的数据规模,并且有严格的SLA要求,同时是百万级别的 QPS,具有ms的查询时延。显然,这样的场景使用传统的 RDMS 是不现实的,在论文之中,提到 Aerospike 的一个典型的应用场景,广告推荐系统,我们来一起看看它们是如何契合的:
HappenLee
2019-01-20
1.4K0
数据分区------《Designing Data-Intensive Applications》读书笔记9
分区与副本是很容易混淆的概念,我们这里离清一下两者。 数据分区的每个副本可以存储在多个节点上。这意味着,即使每个记录恰好属于一个分区,它仍然可以存储在几个不同的节点上进行容错。
HappenLee
2018-09-05
5440
副本机制与副本同步------《Designing Data-Intensive Applications》读书笔记6
首先,如果副本的数据不随时间变化,那么副本的管理是比较简单的:只需要将数据复制到每个节点一次,就OK了。副本管理真正的困难在于对副本数据的修改,这会涉及到很多琐碎的问题。其次,副本复制时要考虑许多权衡,使用同步还是异步复制,以及如何处理失效的副本?接下来我们来一一探讨这个问题。
HappenLee
2018-09-05
8250
线性一致性与全序广播------《Designing Data-Intensive Applications》读书笔记12
大多数分布式数据库至少提供了最终一致性,这意味着如果停止对数据库的写操作并等待一段时间,最终所有读请求将返回相同的值。但是,这是一个非常弱的一致性保证,所谓的一段时间并不确定。如果写入一个值,然后立即读取它,就不能保证读取到刚才写入的值。
HappenLee
2018-09-05
1.1K0
分布式系统的一致性算法------《Designing Data-Intensive Applications》读书笔记13
原子提交防止了数据库处于半更新的状态,这对于需要满足多对象事务和维护次级索引的数据库尤为重要。每个次级索引都是从主数据中分离出来的数据结构,因此,如果修改某些数据,也需要在次级索引中做出相应的更改。通过原子性保证二级索引能够与原数据保持一致。
HappenLee
2018-09-05
5210
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档