前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Go之基于LSM的Key-Value数据库实现WAL篇

Go之基于LSM的Key-Value数据库实现WAL篇

原创
作者头像
IT工作者
发布2022-03-31 13:12:25
4270
发布2022-03-31 13:12:25
举报
文章被收录于专栏:程序技术知识

  上篇文章简单的实现了基于LSM数据库的初步版本,在该版本中如数据写入到内存表后但还未持久化到SSTable排序字符串表,此时正好程序崩溃,内存表中暂未持久化的数据将会丢失。

引入WAL

  为了解决上述问题,将引入数据库中常用于解决类似问题的方法:WAL(Write Ahead Log)预写式日志——在计算机科学中,WAL(预写式日志)是数据库系统提供原子性和持久性的一系列技术;也就是说WAL用于保证数据操作的原子性和持久性;

  不同组件、数据库所使用的WAL实现也有所差异,MySQL、Sqlite、Postgresql、Etcd、Hbase、Zookeeper等都有自己的WAL机制实现;

  在MySQL中是通过Redo、Undo日志实现WAL,当MySQL崩溃后重启时,可以通过Redo重做日志对尚未持久化的操作进行Redo,Undo为撤销操作,MySQL崩溃后可时系统恢复一致的状态;

  在etcd中数据目录下有子目录:wal与snap,两个目录都是WAL机制所产生的;

  1、wal目录存放的数据是记录整个数据库变化过程,数据修改前都需先写WAL文件;

  2、Snap目录存放的是当etcd的wal文件过多是所生成的数据快照文件;

LSMDB的WAL机制实现

一、数据写入

  写入数据时先往WAL文件写入再将数据写入内存表,当内存表数据达到某个阈值进行数据持久化后,将WAL文件清空,此WAL只存储尚未持久化的数据;代码如下:

代码语言:javascript
复制
   /**
设置键值
  */
func (l *LSMStore) Set(key string, value string) {
    var cmd = &SetCommand{Command{1}, key, value}
    //写入wal
    writer := bufio.NewWriter(l.walFile)
    cmdBytes, _ := json2.Marshal(cmd)
    cmdLen, _ := IntToBytes(len(cmdBytes), 4)
    writer.Write(cmdLen)
    writer.Write(cmdBytes)
    err := writer.Flush()
    if err != nil {
        return
    }
    //写入内存表
    l.memoryTable.Put(key, cmd)
    if l.memoryTable.Size() > storeThreshold {
        l.switchTable()
        l.toSSTable()
    }
}

  与之前的区别只在于先写wal文件再写内存表,在switchTable方法中切换内存表的同时切换新旧WAL文件,用于保证与持久化内存表机制是一致的。持久化删除上一步所切换出来的WAL文件;

二、数据恢复

  程序每次启动时都会检查是否有WAL文件存在,如存在WAL则说明程序上一次时异常关闭退出,此时将加载WAL文件,并将WAL数据还原到内存表中;

在还原数据到内存表时还需检查内存表数据是否达到预设的阈值,超过则将其写入到持久化磁盘文件当中;

  上次留下的四大坑,此处填了一个坑,还有三大坑待解决:

  1、索引问题

  2、SSTable合并问题

  3、单机版本问题;

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
云数据库 MySQL
腾讯云数据库 MySQL(TencentDB for MySQL)为用户提供安全可靠,性能卓越、易于维护的企业级云数据库服务。其具备6大企业级特性,包括企业级定制内核、企业级高可用、企业级高可靠、企业级安全、企业级扩展以及企业级智能运维。通过使用腾讯云数据库 MySQL,可实现分钟级别的数据库部署、弹性扩展以及全自动化的运维管理,不仅经济实惠,而且稳定可靠,易于运维。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档