专栏首页飞总聊IT听说TiDB也有大一统的梦想

听说TiDB也有大一统的梦想

作为一个一直在数据库周边打酱油,又没做出什么见得人成绩的伪数据库工作者,每次轮到我写数据库大数据相关的技术文章,或者不说技术,就说科普文章的时候,一个头疼的问题就是我的受众里,懂的人往往会觉得我说的忒简单,而不懂的人又会跳出来,给我留下不知道怎么回应的留言

昨天这篇Oracle的文章Oracle在找死?No Zuo No Die !有人留言表示TiDB也有同样的梦想。TiDB这个东西诞生到现在也有5年时间了,可能还不止。5年时间可以发生很多事情。譬如说,TiDB终于要发布4.0版本了。

要说对TiDB的技术有多了解,我也真的谈不上多了解。比如说TiDB是不是有大一统的想法,我也不知道。我知道的是,TiDB宣传的理念是用户不用太关心自己的查询到底是OLTP还是OLAP。只要在TiDB上能跑起来,都高效率执行就好。

当然,TiDB的整个架构还是蛮复杂的,从最初的要做开源版的Spanner到现在要成为real-time的HTAP的口号也算是改了很久。

TiDB在今年VLDB发了一篇论文,重点介绍其系统。该论文还没有发表出来,但是知乎上有一个TiDB自家人的解读版本。对我来说,这种论文的事情,还是要自己去读几遍,理解一下才能有自己的判断。

这并不是说我自己对自己蜜汁自信,只相信自己的判断。而是论文这个东西,它有其特殊的解读方式。沈向洋大大今年上半年的一个全球直播里面讲怎么去读论文,是一个很值得每个人都去听听的讲话,泄露天机啊。

一般来说,论文里会展现一个事物最美好的一面,说谎是不会说的,但是不好的你也需要自己去字里行间解读,而那些尝试了却失败了的想法,有可能非常的有价值,但是只有同样工作于这一个领域耕耘多年的人,才能从字里行间心有戚戚然了。

TiDB最初是个在KV store上构建出来的“new SQL”,该团队早年有一系列解读自己架构的公众号文章,有兴趣的都可以去读读。后来的发展是引入了列存的TiFlash,魔改Clickhouse的OLAP引擎,之后又对优化器做了改动。论文里应该会有详细的解释,我看了它们自己家出品的对自己论文的解读,但没看到论文的全文。

谷歌的Spanner上云以后卖的并不好。原因很多,成本高是一方面,事务处理的延时高也是一方面。总之这个大杀器,一会GPS一会原子钟的,其实并没有得到什么实际的好处。

亚马逊的Aurora倒是用了非常经典的单点写入方式。但是这也导致了其事务处理性能的瓶颈。而Aurora的多master测试了很久也没最终发布出来。TiDB据说表现在多点写入上性能和扩展都不错。

但是吧,对于HTAP这个东西,我始终都是有一些怀疑态度的。我并不怀疑在一个事务处理的数据库系统中引入冗余的列存方式,从而提高分析查询的性能这个想法。我持怀疑态度的,还是在一个高并发高流量的环境下,进行AP查询的必要性和可靠性。

所以HTAP到底是TP为主导,还是AP为主导,是让TP更好的支持AP,还是在AP的系统上带点TP,一直争议很大。如果一定要硬凹的话,我觉得Oracle就是一个非常非常好的HTAP系统,它家的TP是不用说了,AP也很强。

所以需要HTAP的时候,多半就是在TP环境下提供一些AP查询的便利,我是深深的怀疑HTAP可以直接把数仓给干掉。因为一个真正有意义的AP系统的话,往往需要从很多数据源进行数据清理,最后才能够让垃圾raw data变成为有价值的数据。而这一系列的东西,其实和TP系统关系不大,最好还是专业的人来做专业的事情。

换个说法,我觉得new SQL就是个炒的概念,HTAP又是另外一个炒作的概念。而喜欢把概念一个接一个炒起来的公司,不一定技术方面没独到的地方,事实上通过在Raft层进行列存和行存之间的数据复制,而非在上层通过binlog来进行,这看起来很惊艳。如果你不知道我上面写的是什么可以略过。但是对炒概念起劲的公司的文宣,保持一点警惕的态度,学会辨别什么是实情,什么是套路,没什么坏处。不要一被概念套路了,就觉得万事大吉今晚吃鸡了。

本文分享自微信公众号 - 飞总聊IT(feiitworld),作者:努力赚钱的小作者

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-06-28

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 创造了不起丨TiKV Committer 的最快养成方法

    一月末,一位大三的少年登上了知乎热榜,有数百万人浏览了迟先生的“凡尔赛”语录:“即使一周实习 3 天,我依然拿到了上海交通大学计算机学院第一的绩点。”迟先生是上...

    CNCF
  • 创造了不起丨TiKV Committer 的最快养成方法

    从小学三年级开始写代码,迟先生在初三的时候拿了全国青少年信息学奥林匹克联赛提高组的一等奖。升上高中后的迟先生开始了工程上的实践,学习了前端、后端的大量知识,用 ...

    PingCAP
  • 2020年10月国产数据库排行:GoldenDB跃升异军突起 PolarDB和GaussDB云化融合

    墨墨导读:2020年10月国产数据库流行度的前三位由 TiDB、达梦数据库、GBase(南大通用)获得,其中 TiDB 以超过 100分的优势领先第二位的达梦数...

    xcbeyond
  • TiQuery:All Diagnosis in SQL | TiDB Hackathon 优秀项目分享

    “距离 Hackathon 结束已经一个多星期了,感觉心情还是没有从激情中平复过来。不过由于我读书少,这时候好像只能感慨一句,黑客马拉松真是太好玩了……”

    PingCAP
  • 刘奇:我们最喜欢听用户说的话是「你们搞得定吗?」 | TiDB DevCon 2019

    此外,更有 11 位来自一线的 TiDB 用户为大家分享了实践经验与踩过的「坑」,获得了现场观众的阵阵掌声。同时,我们也为新晋 TiDB Committer 授...

    PingCAP
  • 势高,则围广:TiDB 的架构演进哲学

    本文根据我司 CEO 刘奇在第 100 期 Infra Meetup 上的演讲整理,预计阅读时间为 30 分钟。

    PingCAP
  • 数据库简史(二),戏说中国数据库诸侯史

    基本上每周五大部分可能都不是技术,码这样的文字,其实比技术文字要费劲的多,需要查询的信息很多并且还都不再一个维度上,如果有什么做的不周到,或惹到某些“大佬”谢谢...

    AustinDatabases
  • 让数据库运行在浏览器里?TiDB + WebAssembly 告诉你答案

    希望有一个数据库能够弹性扩展(分布式)到成百上千节点的规模,易于学习和理解,可以运行在私有云、公有云、Multi-Cloud、Kubernetes,也能够跑在嵌...

    PingCAP
  • 刘奇:当今一切都要更实时、更弹性、更简单,TiDB 就是这样的基础设施

    每年我都有一个时间会特别激动,就是产品大版本发布的时候,通常也是社区年度技术大会 TiDB DevCon 举办的时间。去年 TiDB DevCon 2019,我...

    PingCAP

扫码关注云+社区

领取腾讯云代金券