本文是专题的第一篇文章,主要讲解优化数据存储,涉及到锁、批处理、重试机制以及数据一致性等问题。下面 我们就开始吧。
上一篇文章数据架构:概念与冷热分离中介绍了数据架构的概念和意义。并抛出了数据冷热分离的问题。事实上,这并不是新的概念,各公司在很早之前就已经开始了落地实践。微软云有冷热 blob 存储,阿里云有 ots,都是为了在云服务层面提供冷热存储的解决方案。尽管有这些工具,如果很好地实现冷热分离,仍然是值得仔细思考和玩味的。
无论多么复杂的业务场景,一条数据的一生都体现在CRUD操作上——创建、查询、修改、删除。 正如人的生死轮回,数据亦是如此,一条数据随着时间的流逝,其价值也是在逐渐变小。 数据存在的价值则是在于它被使用的程度,在不同的系统中,人们对于不同时期的数据有着不同的需求。 比如12306、携程上的火车、机票订单,人们往往只关注30天之内的订单,而携程正是默认只保留30天的订单信息,超过30天的订单需要通过手机号查找。 携程订单 携程为什么要这么做? 其实仔细想想不难明白,作为全国购票平台,每年数以亿计的订单,如果全
◆ 冷热分离 本文讲的第一个场景是冷热分离。简单来说,就是将常用的“热”数据和不常使用的“冷”数据分开存储。 本章要考虑的重点是锁的机制、批量处理以及失败重试的数据一致性问题。这部分内容在实际开发中的“陷阱”还是不少的。 首先介绍一下业务场景。 ◆ 1.1 业务场景:几千万数据量的工单表如何快速优化 这次项目优化的是一个邮件客服系统。它是一个SaaS(通过网络提供软件服务)系统,但是大客户只有两三家,最主要的客户是一家大型媒体集团。 这个系统的主要功能是这样的:它会对接客户的邮件服务器,自动收取发到几个
之前介绍了数据库的两种最常见的存储模型:NSM 和 DSM (列式存储的起源:DSM),今天介绍这两种存储模型和 HTAP 的联系。
系统的数据,就是公司的生命。哪怕是狗屎,我们也要将它冷冻起来冰封以备后用。垃圾的产品设计就比较让人费解,会时不时从冰柜中将屎取出,想要品尝其中残留的味道。
(实际系统跟这个图是有出入的,不过总体意思是这样。图是使用Excalidraw画的)
|作者 陈爱声,腾讯云数据库高级工程师,目前负责TDSQL PG版(原TBase)的应用系统架构设计工作。 ---- 经常有开源用户跟我交流——“为什么我对TBase的使用和大家的效果是不一样的?” 事实上,在使用分布式数据库的时候有些开发规范还是必须要遵循的。只有遵循了这些开发规范,应用系统使用起来才能够流畅。今天我就和大家分享一下TDSQL PG版(原TBase)数据库的开发规范和最佳实践的问题。 Part 01 TDSQL PG版(原TBase)的由来和架构解析 大概在2015年,微信支付快速发展起
今天下午在思考几个问题,工作的本质是什么?DBA的核心价值是什么?有哪些工作是DBA不可取代的?在整理的过程中,也有了一些心得体会。
作者 | 贾驰千、余智平 酷家乐中间件团队研发工程师 随着云数据库数量以及成本的迅速增加,数据库成本管理和优化成为了企业所关注的方向。酷家乐针对云数据库做了一系列的深度成本优化动作,收益颇丰。本文为详细介绍~ 供你参考。 一、背景摘要 近年来,随着上云的普遍化,降本成为了备受关注的热门话题。越来越多的企业开始重视云资源的成本优化,FinOps更是横空出世,得到了众多企业的拥抱。 作为全球领先的云设计软件平台和 SaaS 服务提供商,(群核科技)酷家乐的产品都构建在公有云之上,截止目前,我们使用了上
TiDB 在使用过程中,随着用户数据量的持续增长,存储成本在数据库总成本中的占比将会越来越高。如何有效降低数据库存储成本摆在了许多用户面前。
Shopee ClickHouse 是一款基于开源数据库 ClickHouse 做二次开发、架构演进的高可用分布式分析型数据库。本文将主要介绍 Shopee ClickHouse 的冷热分离存储架构和支持公司业务的实践。
开头先解释下全功能什么意思,所谓的全功能指的是支持绝大部分的SQL特性,像主键,触发器,约束,函数,存储过程,跨节点join等等。而且这些特性的支持对业务完全透明,业务可以像使用一台单机数据库一样来使用PGXZ。 PGXZ凝结了数平小伙伴们一年多的辛苦劳动,在 2015年10月份正式上线接入业务。当前主要的用户有微信支付,数据平台。最大的线上集群规模31个节点,每分钟55万请求。 本文先介绍下PGXZ的渊源,然后对PGXZ的特性进行下总结。 要讲PGXZ就不得不先说下PGXZ的祖父--Postgresql。
互联网时代,亿级用户各种网络行为产生大量数据,如何解决海量数据存储?如何高性能读写?解决思路有哪些,本文列举了常用的解决方案:
◆ 冷热分离二期实现思路:冷数据存放到HBase ◆ 冷热分离一期解决方案的不足 不得不说,冷热分离一期的解决方案确实能解决写操作慢和热数据慢的问题,但仍然存在诸多不足。 1)用户查询冷数据的速度依旧很慢,虽然查询冷数据的用户比例很低。 2)冷数据库偶尔会告警。 这两点不足体现在用户侧是什么样呢?那就是一旦客服在工单查询表中勾选“查询归档”checkBox,页面就会一直转圈,而后台冷数据库的IO就会飙升。 如果客服发现页面没反应,可能会多点几次“查询”按钮,那么有可能把后台服务器的请求线程占满,导致整个系统
上个周五的时候,Doris官宣了2.0版本,除了在性能上的大幅提升,还有一些特性需要大家特别关注。
我们知道,数据库的数据处理能力是封闭的。所谓封闭性,这里是指要被数据库计算和处理的数据,必须事先装入数据库之内,数据在数据库内部还是外部是很明确的。
P腾讯云数据库国产数据库专题线上技术沙龙已圆满结束,本期带来李巍分享的《TBase主要应用场景与最佳实践》直播视频和文字回顾。 关注“腾讯云数据库”公众号,回复“0416李巍”,即可下载直播分享PPT。 1 前言 大家好,我是李巍,腾讯云TBase架构师。今天跟大家分享的主题是:TBase主要应用场景与最佳实践,整体内容分为四部分。 第一部分:关于TBase。前几期TBase直播分享中已有详细介绍,后面我会简单分享下。 第二部分:TBase的选型。今天将主要从应用的角度上来介绍TBase是如何选型的。
ES体系化梳理第二篇,从基本概念和术语开始,走查了集群中的节点以及其在ES集群中可扮演的角色,最后走查了常见的集群部署架构。本文主要内容有:
Redis 作为高性能缓存被广泛应用到各个业务,比如游戏的排行榜,分布式锁等场景。
作者:jingjunli,腾讯 IEG 后台开发工程师 Redis 作为高性能缓存被广泛应用到各个业务, 比如游戏的排行榜, 分布式锁等场景。经过在 IEG 的长期运营, 我们也遇到 Redis 一些痛点问题, 比如内存占用高, 数据可靠性差, 业务维护缓存和存储的一致性繁琐。由 腾讯互娱 CROS DBA 团队 & 腾讯云数据库团队联合研发的 Tendis 推出了: 缓存版 、 混合存储版 和 存储版 三种不同产品形态, 针对不同的业务需求, 本文主要介绍 混合存储版 的整体架构, 并且详细揭秘内部
ClickHouse 是一款开源的列存 OLAP(在线分析查询)型数据库,实现了向量化执行引擎,具有优秀的 AP 查询性能。Shopee ClickHouse 则是基于 ClickHouse 持续做二次迭代开发和产品架构演进的分析型数据库。
当我们业务数据库表中的数据越来越多,如果你也和我遇到了以下类似场景,那让我们一起来解决这个问题
Redis 作为高性能缓存被广泛应用到各个业务, 比如游戏的排行榜, 分布式锁等场景。经过在 IEG 的长期运营, 我们也遇到 Redis 一些痛点问题, 比如内存占用高, 数据可靠性差, 业务维护缓存和存储的一致性繁琐。由 腾讯互娱 CROS DBA 团队 & 腾讯云数据库团队联合研发的 Tendis 推出了: 缓存版 、 混合存储版 和 存储版 三种不同产品形态, 针对不同的业务需求, 本文主要介绍 混合存储版 的整体架构, 并且详细揭秘内部的原理。
我们对本次HBase成本优化项目进行深度复盘,并进一步尝试总结云数据库的FinOps之道。
本文介绍了分布式数据库在金融互联网场景下的数据治理挑战和实践,重点介绍了PGXZ在微信支付项目中的数据治理方案,包括数据治理工程、数据治理平台、数据治理规范、数据治理流程、数据治理评估等方面的内容。通过严格的数据治理,可以提升数据质量、降低数据不可用风险、提升数据使用效率、提升数据价值。
2、这个页最早修改时间(刷修改时间比较早的页,有可能是热页),方便日志文件的覆盖
本文实例讲述了PHP结合Redis+MySQL实现冷热数据交换应用案例。分享给大家供大家参考,具体如下:
GlobalTransactionManager(简称 GTM), 是全局事务管理器,负责全局事务管理。GTM 上不存储业务数据。
在前面一篇文章中提到过对于业务主表读写缓慢的解决方案:冷热分离,有不了解的请看:业务主表读写缓慢如何优化?
该文介绍了如何基于自研的Grocery框架实现可伸缩的Redis服务,并提供了成本、容量、性能等方面的优化措施。同时,还介绍了一种实现无缝数据迁移的机制,以及一种高可靠的、可扩展的、高性能的Redis服务。
TiDB 6.0 正式提供了数据放置框架(Placement Rules in SQL )功能,用户通过 SQL 配置数据在 TiKV 集群中的放置位置,可以对数据进行直接的管理,满足不同的业务场景需要。如:
关于架构,大家都有了解和理解。通常一个业务或项目,在做架构设计时,可能会包含业务架构和技术架构。其中技术架构是我们作为开发角色,在做设计时重点的工作内容。但还有架构类型的划分方式,会包括业务架构、技术架构、数据架构和应用架构四种。
成熟的业务系统都会配套一个重要的旁路系统--操作日志,它用于监控和记录核心业务系统的操作,以确保系统的稳定性和安全性。
上一篇文章中我们讲解了利用数据库分区与冷热分离的方式来优化存储,虽然解决了查询速度慢的问题,但是在海量数据情况下依然会出现查询缓慢问题,并且部分系统中的冷热数据也是需要频繁或同时查询的。那么,这篇文章中我将带领大家来学习一下如何在设计系统架构时解决海量的数据存储与查询。
这题目让我想起非诚勿扰电影里面的台词,有意思吗?有意思呀!PostgreSQL 有意思,PolarDB for PostgreSQL 有意思。
基于postgresql的内核,则这款数据库默认是可以将单机或集群的PostgreSQL 无缝(演讲者说的)迁移到TBASE。
如果我说:元数据(Meta Data),就是描述数据的数据。没有技术背景加持的路人粉看到这句「绕口令」,内心可能会浮现这样的想法:
Tendis是腾讯互娱CROS DBA团队 & 腾讯云数据库团队自主设计和研发的分布式高性能KV存储数据库,兼容Redis核心数据结构与接口,可提供大容量、低成本、强持久化的数据库能力,适用于兼容Redis协议、需要大容量且较高访问性能的温冷数据存储场景。
Tendis是腾讯互娱CROS DBA团队 & 腾讯云数据库团队自主设计和研发的分布式高性能KV存储数据库,兼容Redis核心数据结构与接口。
2023年11月,腾讯云PostgreSQL在国内首支持PostgreSQL 16.0,包括备份、迁移、审计等功能,用户可以在控制台操作体验。所有用户可使用大版本升级能力升级至最新的PostgreSQL 16.0进行体验,也可以在产品详情页直接购买。
项目简介 Tendis是腾讯互娱CROS DBA团队 & 腾讯云数据库团队自主设计和研发的分布式高性能KV存储数据库,兼容Redis核心数据结构与接口,可提供大容量、低成本、强持久化的数据库能力,适用于兼容Redis协议、需要大容量且较高访问性能的温冷数据存储场景。Tendis目前已经被应用到腾讯内、外部大型项目中。 集群架构 Tendis使用去中心化集群架构,每个数据节点都拥有全部的路由信息,用户可以访问集群中的任意节点,并且通过redis的move协议,最终路由到正确的节点。 每个Tendis节
很多业务中的突发事件,可能会造成比往常多数倍,甚至数十倍的流量冲击。这些流量会冲击后端架构每一层,但是数据库是最后的生命线,也是最难救的。
本人混迹qq群2年多了,经常听到有人说“数据表太大了,需要分表”,“xxxx了,要分表”的言论,那么,到底为什么要分表?
领取专属 10元无门槛券
手把手带您无忧上云