首页
学习
活动
专区
工具
TVP
发布

分布式数据一致性

专栏成员
4
文章
7058
阅读量
1
订阅数
spark任务中的时钟的处理方法
日志的时间戳来自不同的rs,spark在处理这些日志的时候需要找到某个访问者的起始时间戳。 访问者的第一个访问可能来自任何一个rs, 这意味这spark在处理日志的时候,可能收到时钟比当前时钟(自身时钟)大或者小的情况。这时候在计算会话持续时间和会话速度的时候就会异常。
zunhuahu
2021-08-24
5260
Jetcd库使用注意事项
该库是针对etcd V3协议的,因此使用的是grpc协议进行的通信 该库支持ssl协议,ssl支持的时候初始化的方法如下: 📷 grpc是单连接多stream的模式,而实际上,单连接多stream的方式下会出现性能瓶颈的,因此在使用的时候一定要评估好单连接多stream的性能是否满足需求 key设计注意事项: key的数目不宜过多,对于8C16G的机器,差不多50W个key就可以了,这个数值还和key+value的大小有关 key中的信息要在value中重复一次吗?通过实践来看是没必要的,因为无论是
zunhuahu
2021-08-24
7160
Stale NFS file handle 问题分析和总结
因为中工作中遇到了这个问题,也花费了不少的时间去处理 这个问题。希望这篇分析和总结是有用个的。
zunhuahu
2020-03-04
5.3K0
循序渐进理解Paxos
单独去理解Paxos有些困难,本人刚开始的时候直接去看Paxos觉得很复杂。 然后一边阅读《从Paxos到Zookeeper分布式一致性原理与实践》一边去理解Paxos,发现沿着“二阶段提交->三阶段提交->Pax协议”这样这种逐步递进的方式理解Paxos能更好的理解Paxos里面为什么那么做,不那么做会怎样。 下图是我理出的思维导图:
zunhuahu
2020-03-04
5390
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档