开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

分布式键值存储与良好的磁盘压缩？

分布式键值存储是一种将数据以键值对的形式存储在分布式系统中的存储方式。它将数据分散存储在多个节点上，每个节点负责存储一部分数据，并通过键来快速访问和检索数据。

优势：

高可扩展性：分布式键值存储可以根据需求动态扩展节点，以适应数据量的增长，提供高可用性和高性能的存储服务。
高性能：由于数据分散存储在多个节点上，可以并行处理读写请求，提供快速的数据访问和响应。
简单灵活：分布式键值存储通常采用简单的数据模型，只需提供键和值即可存储数据，适用于各种类型的应用场景。
容错性：由于数据分布在多个节点上，即使某个节点发生故障，系统仍然可以继续提供服务，保证数据的可靠性和可用性。

应用场景：

缓存：分布式键值存储可以作为缓存层，提供快速的数据访问，减轻后端数据库的压力。
分布式会话管理：将用户会话信息存储在分布式键值存储中，实现跨节点的会话共享和管理。
分布式配置管理：将系统配置信息存储在分布式键值存储中，实现配置的动态更新和管理。
分布式锁：利用分布式键值存储的原子操作特性，实现分布式锁，保证多个节点之间的数据一致性和并发控制。

推荐的腾讯云相关产品：腾讯云提供了一系列分布式键值存储相关的产品和服务，包括：

腾讯云TDSQL：基于分布式存储引擎的关系型数据库，支持分布式键值存储的功能。
腾讯云COS：对象存储服务，提供高可用性和高可靠性的分布式存储，适用于存储大规模的键值数据。
腾讯云Memcached：分布式内存缓存服务，支持键值存储和高速读写操作。

更多产品介绍和详细信息，请参考腾讯云官方网站：腾讯云产品

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

RocksDB：高性能键值存储引擎初探

在TiDB中（TiDB是一个分布式SQL数据库，其存储引擎TiKV是一个分布式的key-value存储引擎），TiKV使用了RocksDB作为其底层存储引擎，利用RocksDB提供的键值存储与读写功能，以及LSM-tree架构来实现数据的持久化和高效读写。

01

在处理大规模数据时，Redis字典可能会出现的性能问题和优化策略

在处理大规模数据时，要合理选择数据结构、设置合理的过期时间、使用索引和分布式锁等优化手段，以提高Redis字典的性能和可靠性。

07

关于NoSQL，看这篇就够了

NoSQL（Not only SQL）数据库，可以理解为区别于关系型数据库如mysql、oracle等的非关系型数据库。

01

组件分享之后端组件——一个简单且高度可扩展的分布式文件系统seaweedfs

近期正在探索前端、后端、系统端各类常用组件与工具，对其一些常见的组件进行再次整理一下，形成标准化组件专题，后续该专题将包含各类语言中的一些常用组件。

03

从Bitcask存储模型谈超轻量级KV系统设计与实现

Bitcask是一种“基于日志结构的哈希表”（A Log-Structured Hash Table for Fast Key/Value Data）

01

tikv是什么_10千伏高压变频器工作原理

WAL： Write Ahead Log预写日志，数据线通过WAL写入日志（直接落盘sync_log=true），然后再写入缓存；可以防止掉电丢数；一般默认2个WAL文件，数据落盘成功后即可清理；

01

分布式存储理论与实践初探 (一)

硬件基础分布式存储系统是运行在通用计算机硬件体系结构上的底层系统，熟悉各种硬件的性能，能帮助我们更好的调整架构，最大限度地发挥硬件的价值。基础参数常见硬件的大致性能参数如下：类别性能访问L1 Cache0.5ns分支预测失败5ns访问L2 Cache7nsMutex加锁/解锁100ns内存访问100ns千兆网络每秒100MB从内存顺序读取数据每秒4GB(同机房)网络来回RTT0.5ms(同城跨机房)网络来回RTT1~2ms(不同城跨机房)网络来回RTT300~100msSATA磁盘寻道10msSAT

05

深入理解HBase架构

在这篇博客文章中，我们主要深入看一下H Base 的体系结构以及在 NoSQL 数据存储解决方案主要优势。

05

etcd、Zookeeper和Consul一致键值数据存储的性能对比

许多现代分布式应用程序都建立在分布式一致键值存储之上。Hadoop生态系统中的应用程序和“Netflix栈”的许多部分都使用Zookeeper。Consul公开了服务发现和运行状况检查API，并支持Nomad等集群工具。Kubernetes容器编排系统，MySQL的Vitess水平扩展，Google Key Transparency项目以及许多其他系统都是基于etcd构建的。有了这么多关键任务集群，服务发现和基于这些一致键值存储的数据库应用程序，测量可靠性和性能是至关重要的。

02

分布式存储

分布式存储的思想是将数据分散存储在多个节点上，以提高数据的可靠性、可扩展性和性能。它基于以下几个核心思想：

01

Pinterest 大规模缓存集群的架构剖析

本文由 Kevin Lin 发表在 medium.com，经原作者授权由 InfoQ 中文站翻译并分享

03

2022 IoTDB Summit：IoTDB PMC 乔嘉林《端边云协同：Apache IoTDB 全新单机分布式架构》

12 月 3 日、4日，2022 Apache IoTDB 物联网生态大会在线上圆满落幕。大会上发布 Apache IoTDB 的分布式 1.0 版本，并分享 Apache IoTDB 实现的数据管理技术与物联网场景实践案例，深入探讨了 Apache IoTDB 与物联网企业如何共建活跃生态，企业如何与开源社区紧密配合，实现共赢。

01

大规模分布式存储系统原理解析与架构实战

1.分布式存储系统是大量普通 PC服务器通过Internet互联，对外作为一个整体提供存储服务

04

微服务架构下数据如何存储？有考虑过吗？

微服务架构下，很适合用 DDD（Domain-Drive Design）思维来设计各个微服务，使用领域驱动设计的理念，工程师们的关注点需要从 CRUD 思维中跳出来，更多关注通用语言的设计、实体以及值对象的设计。至于数据仓库，会有更多样化的选择。分布式系统中数据存储服务是基础，微服务的领域拆分、领域建模可以让数据存储方案的选择更具灵活性。

01

单机、集中式、分布式和云原生存储

本文主要对杨传辉（日照）《大规模分布式存储系统原理解析与架构实战》、大话存储、网络资源(具体参考文末链接)及个人理解进行整理，意在构建出存储发展基本轨迹和一些基本常识，让更多像我一样的初入者有个宏观上的认知。

02

LSM与TSM原理分析

点击上方蓝字，发现更多精彩导语 LSM作为一种重要的数据存储结构方式，被许多大型开源存储系统应用为底层引擎的存储结构。同时由于influxDB的不断改良，一种基于LSM的改良数据结构TSM也开始被熟知并广泛应用。本文将基于官方文档和相关论文分析该两种数据结构的组成原理和应用特点。 LSM（Log-Structured Merge Tree）日志结构合并树 ° 模型发展由于b+树具有稳定查询效率、逻辑上有序的数据存储等特点，使得b+树成为了许多RDBMS的底层引擎的数据结构。不过，b+数的有序数据存储仅

03

01 . 分布式存储之FastDFS简介及部署

两阶段提交协议（Two-phase Commit，2PC）经常用来实现分布式事务，在两阶段协议中，系统一般包含两类节点：一类为协调者（coordinator），通常一个系统中只有一个；另一类为事务参与者（participants，cohorts或者workers），一般包含多个。协议中假设每个节点都会记录操作日志并持久化到非易失性存储介质，即使节点发生故障日志也不会丢失。执行过程如下：

06

【Redis 学习笔记】1、Redis 简介

说到 Redis，大家可能第一反应就是它是当前最受欢迎的 NoSQL 数据库之一。那么在正式介绍 Redis 之前，我们先来看看关于 NoSQL 的一些相关信息，比如它是什么，又比如它的一些特点以及它的一些分类。那么我们接下来就从以上三个方面来对 NoSQL 的相关历史做一个简单介绍，然后再去看看 Redis 的相关知识。

02

微信 PaxosStore:海量数据冷热分级架构

导语本文整理自笔者在“腾讯大讲堂”的演讲。作者介绍：杨平安，来自广州的微信事业群，在腾讯已经工作五年。主要分享内容：为何公司卓越研发金奖花落PaxosStore；隐匿在业务后的大数据统计特征；架构迭代的现实与实现 [1497342605007_5944_1497342605398.jpg] [1497342625506_980_1497342625782.jpg] 在作这份PPT的时候，我对自己这五年的时光进行了一下简单的回顾，发现可以分成两个主题。这两个主题就在我的职业生涯中不断交织，爱恨情

一网打尽 NoSQL：当下 NoSQL 类型、适用场景及使用公司

在互联网和大数据的背景下，越来越多的网站、应用系统需要支撑海量数据存储、高并发请求、高可用、高可扩展性等特性要求。传统的关系型数据库 RDBMS 已经难以应对类似的需求，各种各样的 NoSQL（Not Only SQL）数据库凭借易扩展、大数据量和高性能以及灵活的数据模型成功的在数据库领域站稳了脚跟。本文将分析传统数据库的存在的问题，以及几类 NoSQL 如何解决这些问题。在不同的业务场景下，作出正确的数据存储技术选型。

02

「大数据系列」Ignite：基于内存分布式数据库和缓存和处理平台

Ignite™是一个以内存为中心的分布式数据库，缓存和处理平台事务性，分析性和流式工作负载，以PB级的速度提供内存速度. 主要好处 Ignite 使用者包括 ING, Sberbank, HomeAw

02

一文科普 RocksDB 工作原理

会保证每周不低于两篇更新，订阅方式见👉这里，欢迎喜欢我文章的朋友们的订阅支持，激励我产出更多优质文章。 RocksDB 是很多分布式数据库的底层存储，如 TiKV、CRDB、NebulaGraph 等等。在 DataDog 工作的 Artem Krylysov 写了一篇文章（原文链接：https://artem.krylysov.com/blog/2023/04/19/how-rocksdb-works/）来对 RocksDB 做了一个科普，通俗易懂，在这里翻译下分享给大家。

03

分布式存储系统三要素，掌握这些就离成功不远了

在上一篇文章中，我们一起学习了 CAP 理论（想要设计一个好的分布式系统，必须搞定这个理论）。该理论指出，在分布式系统中，不能同时满足一致性、可用性和分区容错性，指导了分布式数据存储系统的设计。

02

DBA老挂在嘴边的kafka到底是啥？今天终于能讲清楚了。

| 作者马艺超，腾讯课堂开发工程师，主要负责腾讯课堂的后台相关业务开发。 ---- 消息队列是分布式系统中重要的组件，在很多生产环境中需要控制并发量的场景下都需要用到。最近在做需求的时候遇到一些高并发的场景需要用到消息队列来完成，这里关于对kafka的简单了解和使用，给大家做一个简单的分享。 Part1 什么是Kafka Kafka 是由 Linkedin 公司开发的，它是一个分布式的，支持多分区、多副本，基于 Zookeeper 的分布式消息流平台，它同时也是一款开源的基于发布订阅模式的消息引擎系统

01

【大数据技术】Hadoop体系框架详细解析

Mapreduce是一种模式，一种什么模式呢?一种云计算的核心计算模式，一种分布式运算技术，也是简化的分布式编程模式，它主要用于解决问题的程序开发模型，也是开发人员拆解问题的方法。如下图所示，ma

03

ClickHouse深度解析，收藏这一篇就够了~

五、核心概念 5.1.表引擎（Engine）表引擎决定了数据在文件系统中的存储方式，常用的也是官方推荐的存储引擎是MergeTree系列，如果需要数据副本的话可以使用ReplicatedMergeTree系列，相当于MergeTree的副本版本。读取集群数据需要使用分布式表引擎Distribute。 5.2.表分区（Partition）表中的数据可以按照指定的字段分区存储，每个分区在文件系统中都是都以目录的形式存在。常用时间字段作为分区字段，数据量大的表可以按照小时分区，数据量小的表可以在按照天分区或者月分区，查询时，使用分区字段作为Where条件，可以有效的过滤掉大量非结果集数据。 5.3.分片（Shard）一个分片本身就是ClickHouse一个实例节点，分片的本质就是为了提高查询效率，将一份全量的数据分成多份（片），从而降低单节点的数据扫描数量，提高查询性能。 5.4. 复制集（Replication）简单理解就是相同的数据备份，在CK中通过复制集，我们实现保障了数据可靠性外，也通过多副本的方式，增加了CK查询的并发能力。这里一般有2种方式：（1）基于ZooKeeper的表复制方式；（2）基于Cluster的复制方式。由于我们推荐的数据写入方式本地表写入，禁止分布式表写入，所以我们的复制表只考虑ZooKeeper的表复制方案。 5.5.集群（Cluster）可以使用多个ClickHouse实例组成一个集群，并统一对外提供服务。六、主要表引擎深入解析 6.1.TinyLog 最简单的表引擎，用于将数据存储在磁盘上，每列都存储在单独的压缩文件中，写入时，数据附加到文件末尾. 缺点：（1）没有并发控制（没有做优化，同时写会数据会损坏，报错）（2）不支持索引（3）数据存储在磁盘上优点：（1）小表节省空间（2）数据写入，只查询，不做增删改操作创建表： create table stu1(id Int8, name String)ENGINE=TinyLog 6.2. Memory 内存引擎，数据以未压缩的原始形式直接保存在内存中，服务器重启，数据会消失，读写操作不会相互阻塞，不支持索引。建议上限1亿行的场景。优点：简单查询下有非常高的性能表现（超过10G/s）创建表: create table stu1(id Int8, name String)ENGINE=Merge(db_name, 'regex_tablename') 6.3.Merge 本身不存储数据，但可用于同时从任意多个其他的表中读取数据，读是自动并行的，不支持写入，读取时，那些真正被读取到数据的表的索引（如果有的话）会被占用,默认是本地表，不能跨机器。参数：一个数据库名和一个用于匹配表名的正则表达式创建表： create table t1(id Int8, name String)ENGINE=TinyLog create table t2(id Int8, name String)ENGINE=TinyLog create table t3(id Int8, name String)ENGINE=TinyLog create table t (id UInt16, name String)ENGINE=Merge(currentDatabase(), ‘^t’) 6.4.MergeTree ck中最强大的表引擎MergeTree(合并树)和该系列（*MergeTree）中的其他引擎。使用场景：有巨量数据要插入到表中，高效一批批写入数据片段，并希望这些数据片段在后台按照一定规则合并。相比在插入时不断修改（重写）数据进行存储，会高效很多。优点：（1）数据按主键排序（2）可以使用分区（如果指定了主键）（3）支持数据副本（4）支持数据采样创建表： ENGINE MergeTree() PARTITION BY toYYYYMM(EventDate) ORDER BY (CounterID, EventDate, intHash32(UserID)) SAMPLE BY intHash32(UserID) SETTINGS index_granularity=8192

02

Kafka的生成者、消费者、broker的基本概念

kafka是一款基于发布与订阅的消息系统。它一般被称为“分布式提交日志”或者“分布式流平台”。文件系统或者数据库提交日志用来提供所有事物的持久化记录，通过重建这些日志可以重建系统的状态。同样地，kafka的数据是按照一定顺序持久化保存的，可以按需读取。

04

MapReduce与批处理------《Designing Data-Intensive Applications》读书笔记14

批处理系统通常也叫脱机系统，需要大量的输入数据，运行一个作业来处理它，并产生一些输出数据。工作通常需要一段较长的时间（从几分钟到几天）。批处理作业通常是周期性地运行的（例如，一天一次）。批处理作业的主要性能度量通常是吞吐量。

03

深入浅出学大数据（四）MapReduce快速入门及其编程实践

此系列主要为我的学弟学妹们所创作，在某些方面可能偏基础。如果读者感觉较为简单，还望见谅！如果文中出现错误，欢迎指正~

04

tidb本周精选 2021年的第 31 周

将数据按照 key 的范围划分成大致相等的切片（下文统称为 Region），每一个切片会有多个副本（通常是 3 个），其中一个副本是 Leader，提供读写服务。

05

完爆90%的性能毛病，数据库优化八大通用绝招！

毫不夸张的说咱们后端工程师，无论在哪家公司，呆在哪个团队，做哪个系统，遇到的第一个让人头疼的问题绝对是数据库性能问题。如果我们有一套成熟的方法论，能让大家快速、准确的去选择出合适的优化方案，我相信能够快速准备解决咱么日常遇到的80%甚至90%的性能问题。

03

ClickHouse 表引擎 & ClickHouse性能调优 - ClickHouse团队 Alexey Milovidov

显然RAM可能比磁盘慢，例如单个clnannel RAM与10倍 PCIe 4.0 SSD。

02

使用这8招后，数据库查询从191s优化到30ms！

毫不夸张的说咱们后端工程师，无论在哪家公司，呆在哪个团队，做哪个系统，遇到的第一个让人头疼的问题绝对是数据库性能问题。如果我们有一套成熟的方法论，能让大家快速、准确的去选择出合适的优化方案，我相信能够快速准备解决咱么日常遇到的80%甚至90%的性能问题。

01

【系统设计】分布式键值数据库

键值存储 ( key-value store )，也称为 K/V 存储或键值数据库，这是一种非关系型数据库。每个值都有一个唯一的 key 关联，也就是我们常说的键值对。

02

Redis学习1：入门简介及基本命令操作

这些就是NoSQL 那么就是 Not-Only-Sql，泛指非关系型数据库，作为关系型数据库的补充。

01

数据系统读写权衡的一知半解

在计算机领域，有一个有趣的趋势，往系统中写入数据需要做更多的工作。我们需要对数据进行重新组织、合并、重新建立数据库索引等操作，才能使写入的内容更加有用。如果不这样做，必须实现内容搜索或其他工作来支持未来的数据读取。

02

分布式文件系统FastDfs

随着文件数据的越来越多，通过tomcat或nginx虚拟化的静态资源文件在单一的一个服务器节点内是存不下的，如果用多个节点来存储也可以，但是不利于管理和维护，所以我们需要一个系统来管理多台计算机节点上的文件数据，这就是分布式文件系统。

02

后端思维之数据库性能优化方案

毫不夸张的说咱们后端工程师，无论在哪家公司，呆在哪个团队，做哪个系统，遇到的第一个让人头疼的问题绝对是数据库性能问题。如果我们有一套成熟的方法论，能让大家快速、准确的去选择出合适的优化方案，我相信能够快速准备解决咱么日常遇到的80%甚至90%的性能问题。

04

Redis相关知识点汇总

Redis服务器是一个事件驱动程序，服务器需要处理以下两类事件：文件事件（服务器对套接字操作的抽象）和时间事件（服务器对定时操作的抽象）。Redis的定时机制就是借助时间事件实现的。一个时间事件主要由以下三个属性组成：id：时间事件标识号；when：记录时间事件的到达时间；timeProc：时间事件处理器，当时间事件到达时，服务器就会调用相应的处理器来处理时间。一个时间事件根据时间事件处理器的返回值来判断是定时事件还是周期性事件。

02

微信基于时间序的海量存储扩展性与多机容灾能力提升

作者：jeryyzhang，腾讯 WXG 后台开发工程师背景介绍业务场景作为以手机为主要平台的移动社交应用，微信内大部分业务生成的数据是有共性可言的:数据键值带有时间戳信息，并且单用户数据随着时间在不断的生成,我们将这类数据称为基于时间序的数据。例如朋友圈的发表，支付账单流水，公众号文章阅读记录等。这类基于时间序的数据通常不会删除，而是会随着时间流逝不断积累，相应需要的存储空间也与日俱增：key 量在万亿级别，数据量达到 PB 级别，每天新增 key 十亿级别。同时在十亿用户的加持下，每天的访问

01

hadoop 各种概念整理

Hadoop实现了一个分布式文件系统（Hadoop Distributed File System），简称HDFS。

03

数据库系统设计概述

数据是系统最重要的信息。大部分系统都是对数据的管理。应用系统通过数据模型来构建现实世界，通过算法操作对象或数据结构，来改变数据模型的状态。数据被组织在操作系统文件中，我们通过数据系统来组织，查询，搜索，处理数据。

06

分布式数据库企业级功能技术解密与最佳实践

阅读字数: 2739用时: 10分钟本文内容来源于彭旸在OSC源创会上海站上的主题演讲，IT大咖说为与开源中国合作的视频知识分享平台。内容摘要对于真正企业级应用，需要分布式NoSQL/NewSQ

05

处理大规模图数据的存储和计算需求的技术和策略

将大图分割成较小的子图，并将每个子图存储在单独的节点或分布式存储中。这样可以减小单个节点的存储和计算负载，并提高并行处理的效率。

07

MapReduce 基础学习

通常来讲，计算节点和存储节点是同一个，即mapreduce框架和hadoop分布式文件系统运行在相同的节点集群，使得任务调度更加高效，网络带宽更聚合。

01

深入理解什么是LSM-Tree

十多年前，谷歌发布了大名鼎鼎的"三驾马车"的论文，分别是GFS(2003年)，MapReduce（2004年），BigTable（2006年），为开源界在大数据领域带来了无数的灵感，其中在 “BigTable” 的论文中很多很酷的方面之一就是它所使用的文件组织方式，这个方法更一般的名字叫 Log Structured-Merge Tree。在面对亿级别之上的海量数据的存储和检索的场景下，我们选择的数据库通常都是各种强力的NoSQL，比如Hbase，Cassandra，Leveldb，RocksDB等等，这其中前两者是Apache下面的顶级开源项目数据库，后两者分别是Google和Facebook开源的数据库存储引擎。而这些强大的NoSQL数据库都有一个共性，就是其底层使用的数据结构，都是仿照“BigTable”中的文件组织方式来实现的，也就是我们今天要介绍的LSM-Tree。

Redis入坟（一）redis的前世今生、redis基础及存储结构源码讲解

08 年的时候有一个意大利西西里岛的小伙子，笔名 antirez，创建了一个访客信息网站 LLOOGG.COM。有的时候我们需要知道网站的访问情况，比如访客的 IP、操作系统、浏览器、使用的搜索关键词、所在地区、访问的网页地址等等。在国内，有很多网站提供了这个功能，比如 CNZZ，百度统计，国外也有谷歌的 Google Analytics。我们不用自己写代码去实现这个功能，只需要在全局的 footer 里面嵌入一段JS 代码就行了，当页面被访问的时候，就会自动把访客的信息发送到这些网站统计的服务器，然后我们登录后台就可以查看数据了。

05

后端思维之数据库性能优化方案

毫不夸张的说咱们后端工程师，无论在哪家公司，呆在哪个团队，做哪个系统，遇到的第一个让人头疼的问题绝对是数据库性能问题。如果我们有一套成熟的方法论，能让大家快速、准确的去选择出合适的优化方案，我相信能够快速准备解决咱么日常遇到的80%甚至90%的性能问题。

08

Redis入门简介

Redis是一个Key-Value存储系统。和Memcached（高性能的分布式内存对象缓存系统，用于动态web应用以减轻数据库负载），它支持存储的value类型相对更多，包括String(字符串)，list(链表)，set(集合)和zset(有序集合)。这些数据类型都支持push/pop、add/remove及取交集并集和差集及更丰富的操作，而且这些操作都是原子性的。在此基础上，Redis支持各种不同方式的排序。与Memcached一样，为了保证效率，数据都是缓存在内存中。区别的是Redis会周期性的把更新的数据写入磁盘或者把修改操作写入追加的记录文件，并且在此基础上实现了master-slave（主从）同步。

00

读猿码系列——2. 搞懂Etcd核心API

小区从管控区调整为防范区了，40多天的封闭后终于可以光明正大地下楼遛狗了！许愿能尽快吃上平价麦当劳，而且每顿都有可口可乐！日拱一卒，让我们开始吧！（长文预警哦）

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭