00:27
之前腾讯在用什么数据库啊,大大小小的,可能自研的有数十款数据库,现在的年轻人这一代几乎都不知道这个故事,一个百万富翁的对市场的这个影响力和效果比十个教授都管用。所以呢,你还没理解数仓是什么呢,人家已经说数仓都已经落伍了,我记得三四年前啊,我们当时最主要的竞争那个不是有章,就算达到了,我也在这个场面下,我会用Oracle,你觉得高射炮打蚊子了,况且还打不好。过去几年可能在gotner forest这种的魔力象限里面,云场上已经往第一象限走了。大家好,这次是由腾讯云、TVP技术指针和明说三人行联合策划的中国数据库的前世今生,我是主持人明叔,我们上一次聊到了00年代的中国数据库的发展,10年代我们会看到中国数据库发展的完全不一样的格局。今天还有。
01:27
左边还是我们的老朋友郑晓军,我就不多介绍了啊,右边我们请到了腾讯云数据库no CQ产品负责人邹鹏,呃,两位跟我们的今天的观众打个招呼,大家好,咱们又见面了,OK, 呃,大家好,我叫周鹏,然后呢是来自于腾讯云数据库团队,然后过去大概五六年的时间吧,一直在腾讯的数据库团队负责no circle口的产品的一些工作,非常高兴啊,今天能够跟零售啊郑老师一起来去聊聊过去一二十年数据库的一些故事。
02:01
我们每一次聊到这些年代性的东西的时候,我都会问一个问题啊,就是邹鹏,2010年的时候你在哪儿?呃,2010年啊,刚毕业,刚毕业,对,那时候毕业以后是去做数据库了吗?没有,那时候呢,其实在做安全,我那会儿我我是安全专业毕业的,对在做安全相关的工作,OK, 然后哪一年转到数据库了嘛,2016年,2016年,对,然后我是搬搬厨师家到数据库这个赛道里面来,2016年吧,刚好是也是比较热闹的时候,热闹的时候,对,就是刚好是呢,国内的云在发展的一个阶段,就云的真正开始起步,对对,就那会儿,然后呢,就经历了第一代的国内的云数据库的一个发展历程,非常好。小军,2010年的时候在哪儿了?我2010年的时候还在IBM,实际上我是一二年去的Oracle,也就是在IBM的最后这两年了,我10年的时候呢,呃,也是一个在我职业生涯里边挺关键的一年,是一个转折点。
03:01
就是SAP收购了塞贝斯,塞贝斯其实我对他的理解,对他的认知还停留在说有知道有这么个东西在这儿,但是我说一个产品,你可能对他认知多一些,Microsoft server, 或者或者或者我这样问,如果我说有一个产品叫server,你会认为他是哪家的?是塞贝斯的震惊吗?今天第一次知道,对,因为这个名字是曾经微软和塞贝斯共有的,但是最后塞贝不得不放弃了这个名字,自己又起了一个名字,叫什么A,还有这个故事,所以我就说现在这个现在的年轻人这一代几乎都不知道这个故事,一定要看98090年一定要看,回头回去翻一下,做了一个数据库的从业者。其实在10年开出的时候啊,待会儿我们在MYSQL上面去在折腾,因为互联网公司呢,基本上对这种传统商业的数据库的采用还是很谨慎的,可能不能从预算还是技术的角度来讲,它可能更多的选用的就是那时候还是开源的技术嘛,那时候应该还是5点几,5.1还是5.3的样子,反正应该可能还是更老的版本,他其实能力一般般,就感觉那个六七十分的样子,你需要在业务,要在上面做很多的事情,那时候上来就是干什么,各种分库分表,然后脚本,每天就create一张table,然后要去做各种的事儿,因为那时候基本上也还没有什么分布式数据库嘛,互联网就在开源的数据库上面去做各种增长,SH2顶哈,那个时候最火的词,那个时候最火的词儿是SH2顶是吧,对对对,但是SH顶基本上都是靠应用来下顶,靠应用来删数据库,提供的功能基本没有,后来是有限对数据库,我感觉那时候应该可能就是内核你都还没有做,非常stable,因为那会儿我觉得还是MYMYSM。
04:44
为主嘛,以no DPG, 因为它没有完整的出来,所以说那会儿那时候应该还是呃,数据库啊,开源的数据库在快速的迭代,然后呢,互联网公司用自己的在应用层的一些方案去把整个业务给支撑下来,MYSQ是哪年被Oracle收购的,2008年,所以那时候他已经归Oracle了嘛,是吧,但是从互联网只用就是当时选型数据库的时候来说,应该买CQ是还是首选了。
05:13
因为我是大概是一三年加入腾讯的吧,然后来我后来回过头来去看,我看之前腾讯在用什么数据库哈,应该大大小小的自研呢,有数十款数据库,但是可能这跟这种腾讯公司这种体量的业务有关系啊,因为它的体量确实大,它的用户都是一级的,开源的单机方案一定解决不了它,所以他会自研一些东西,为什么要做几十款,这是一个问题,第二一个问题呢,就是这几十款,我相信有几个应该算是明星数据库,算是比较成功的,这些成功的有曾经想过商业化嘛,那个时候他主要的角色是支撑的业务,所以说真正要去看到腾讯要考虑把这些技术商业化的是是因云有有了云之后才可能考虑这块的,腾讯做云其实就是互联网公司的技术外溢嘛,对吧,我已经把这个技术能够把我这己这么这么大体量的业务都支撑好了,那这样的技术拿到外面去,那一定有价值,然后回到可能刚说明刚才明叔说的问题,为什么会有几十款,我估计大大小小的,反正把各种小。
06:14
把它算起来一二十款是有的,因为从00年到10年的时候,那时候的业务发展非常的快,对吧,就是你你从PC到移动互联网,它的整个业务的数据是爆炸式的增长的,你通用的一个解决方案其实很难应对不同的的,但是慢慢慢慢的到过去这五六年,七八年的时间,这些技术就在收拢了,因为这些通用的底层的技术已经呃完善了,比如分布式的技术啊,这些rap的技术啊,然后加上这些呃硬件的发展,然后呢,底层的数据库的能力也追上来了,所以说慢慢现在这些技术基本上就在收敛,都在往云上,现在统一的一些技术在靠拢,但是直到今天,其实呃,腾讯内部还是有不少的一些自研的数据库,他可能一些是存量的原因,还有一块就是确实场景超大,比如说像今天在微信,那他们其实比如说视频号啊,微信的朋友圈这种它的体量,他的那块的话,同样的数据库,你今天呢,开源的数据库还是很难去支撑它的一些场景,所以说他们还是需要定制化,你们会拿出来开源吗?其实。
07:14
其实有一些项目还是有的啊,比如说我之前我负责的一个KV数据库叫tens,它是做一个reading协议的KV存储,其实我们就把它开源出来了,我我记得微信那边也也有一些开源的数据会出来,就是全面的影响力挺好挺好。我觉得其实10年代还有一个大的主线,这个咱们上次在00年的结尾的时候恰好聊到了,就是大数据的这个运动在00年后末期是开始了,10年就基基本上我认为是大数据整个席卷市场的这个,这个势头就有点像现在,呃,无人不谈AI 1010年代那个时候应该是无人不谈大数据的,小军那时候肯定跟我差不多,也在到处都卖IBM的或者是Oracle的大数据的解决方案,是吧,我的那个时代呢,稍稍有一点点不同,呃,因为在大数据出来之前。
08:15
呃,在IBM这样的公司,它一定是以数据仓库去支撑BI解决方案为主的,但是有了大数据以后,IBM呢,实际上实验室里呢,就在思考哪些分布式文件系统里头有这个map reduce这样的技术,这个技术什么东西可以得益呢?一些数据挖掘的算法。在这上用map reduce重新写,然后让它去运行在卡杜普这样的平台上,比我们传统的下载关系型数据库上的效果要好,这是我的技术上的支撑,商业上呢,有一个什么支撑呢?就是说之前你如果是在外企去做BI,去做数据仓库的时候,你会发现你的用户有些当然是已经很好的接受了,有些人他还会傻不愣登的觉得,哎,数据仓库有啥用啊,啊,BI能够给我带来什么经济效益啊?哎,我听说数据仓库10个项目9个失败啊,你还会被这些话困扰,但是大数据出来的好,好在哪里?
09:23
也就是说一个百万富翁的对市场的这个影响力和效果比10个教授都。管用,坦率的说,行业客户都在跟着it这帮人的脚步或者是口吻去试图理解你说的这个东西到底是啥,但是又因为it这个这个名词变迁太快。所以呢,你还没理解数仓是什么呢,人家已经说数仓。都已经落伍了,现在这数据湖了,说啥叫数据湖啊,你说你你看一下这本书,等你看完这本书的时候,数据湖都已经变成云数据,或者是叫什么数据平台了,全都在变,一直在变,IBM也好,Oracle也好。
10:05
其实都很擅长把用户概念上砸晕以后卖东西,你砸晕了以后,你觉得我从理念上。比你高一个维度的时候,我在卖你东西,先不说你会不会买,但是你只要买的话,你就不敢跟我砍价钱,当然你是接受了这个思想,然后他就值这个价格,但是嗯。大数据为什么成功?而且大数据不仅是在00年代,10年代成功。我认为它的寿命。这个词的寿命经久不衰。为什么呢?就是因为你不管是中文的大数据还是英文的。都极其容易理解。极其容易理解。既容易理解,后面的内涵又很高。对吧,因为它给了你无限的想象空间,它是一个框。大数据是一个框,几乎所有东西都可以扔到框里面去,当这个概念词出现这么一个词以后,它的力太大了,你知道这个在技术上有些什么支撑了。
11:07
呃,我我来分享一下这块啊,实际上我自己就是从这个数据仓库来到的大数据哈。数据仓库的时候呢,它采集的对象呢,比较有限,是你过去or TP业务系统这些你现有的系统为主的。那么到了大数据时代,你其实更加泛化。你可以在互联网上拿你的外部的数据,对吧,你可以采集这个手持设备,或者你的这些机器啊,也就是你的面更加广了,数据更多了,这个是这个表象,但是在这个分析数据的理念上来讲呢。有一个新的视角。也就是说,如果这个时光倒播到80年代,你到大学里去搞这个人工智能,自然语言处理,你去研究语法。
12:03
研究这些规则去推动NLP的话,它的发展其实挺慢的。但今天其实你去看互联网上的这些值NLP14亿人民,他怎么讲汉语?它所呈现的规则规律就是语法了,就是这句话的本意了,那么这件事情在没有这些数据量灌入这个模型的时候。你是做不到的,实际上大的数据来了以后,有些规律是从数学从这么能得到的,这个空间是我以前在用数据仓库的时候,不会采用这样的思维,这样的方法来得出我对自然世界的这样一个理解,所以大数据不光是数据量大,而且让你推理,让你得到这个事实的这个方法也随之改变。我接着从互联网这个角度去聊一聊这个大数据啊,应该大数据在互联网应该我觉得是可能是最早去看到的商业化价值的一个地方啊,今天你在你手机里面用的各种APP。
13:10
然后它背后基本上主流的哈,都有一套推荐系统,这套推荐系统是实靠什么驱动的,其实就大数据驱动的我们的各种业务,为了它更好的理解商品,或者这些文章,或者这些它在互联网里面的各种素材,要足够的数据,然后来去理解你这个商品的内容,这是一个角度,另外一个角度是我们就拿一个电商的场景来说,他就通过你今天各种你的浏览的数据,你浏览的行为,把你的画像构建出来,通过你的画像呢,剩下就是推荐,就是规则了嘛,其实今天这套系统在互联网里面是非常重要的一个支撑,现在是所有的互联网的,你看到的所有的信息啊,都是这套系统才支撑的,不管我们今天看到的短视频,你看你的短视频为什么会能够连续的刷个4个小时,8个小时不停,因为他知道你喜欢什么东西,然后呢,他知道你的画像呢,就不停的给你推,而且今天这些推荐是实时的,比如你现在去一个电商里面,你就点一个商品,就马上接下来他的。
14:11
整个推荐列表会实时的变化,对,而且他每个人不一样,千人见面。呃,我想突然想起来数据仓库为啥不讨人喜欢啊?呃,数据仓库的建设可以在没有业务需求的时候,这个项目就可以启动,但是在大数据领域,我很少会因为没有这个业务需求的情况下,我单累大数据,实际上大数据的很多项目,他在业务层面的作用,实际上它的构思比数据仓库要更为成熟,这些东西实际上是比较坚实的一个业务的需求,我我就我有我有不同的意见,过去的几十年里边很少有一个技术或者是有一个方向的落地是由用户驱动的,几乎都是被洗脑的,也就是说是有了智能手机摆在你面前,你才觉得,诶,对呀,我也许可以花几。
15:17
千块钱去买一个手机来来玩儿玩儿,嗯,在这之前你是没有一个需求,说你们那些诺基亚的键盘那么不好,能不能给我变成一个全触摸屏的,没有人有这个需求。民宿这个点呢,其实我也有一些不同的视角,我觉得这块得分TOC和to b来看,手机这种消费是TOC的,TOC是容易冲动的,然后他容易被引导,对吧,今天就看到一个代言人很帅,是我偶像,我就买他。但是呢,如果回到to b那儿,我觉得基本上还是会以那种价值驱动为主,就是以按需求导向为主,整个to b的一个决策链,它还是会要价值导向的清晰的多,我今天有这样的需求,有这样的痛点,然后呢,他会给你提这样的需求,厂商看到这样的一些用户难处了,他会觉得这是机会,因为每一个困难,每一个痛点就是一个机会。
16:06
我们拉回来聊聊具体的技术啊,大数据这个时代里边,真正的从数据库的角度来讲出来了一些什么样的东西,我觉得这块儿造痛来了,回过头来去聊,在大数据以后啊,那10年的时候,呃,数据库的一个发展就是no circlelel这个方向,No circlele呢,第一个跑出来的最大的一个体量是像瑞这样的一个内存数据库,就是卡杜普,是卡杜普呢,我觉得是大数据时代的一个东西对,它支撑了我们大量离线的这种分析,H base其实会有一段很长的时间就支撑着那种海量的KV存储,但是呢,我的理解中,H base在国内在在线这一块的常景没那么多,我看到的更多的还是从瑞这样的一个技术战,就在线这一块啊,H base呢,最主要还是在支撑离线这一块的一个场景做大数据分析,然后在线这一块呢,是分布式的数据库来去讲noser有几个特点,第一个它上来都是分布式的,第二个呢,它都在强调它的性能,就是强调它的延迟,基本上都毫秒级的。
17:07
而且是基本上稳定的,你看像radi这种都是一毫秒以内的这种的响应,它的P99,我们就是线上就两三毫秒的一个P99,这是你在传统的数据库里面你不敢想象的吧,我但凡多写个V2,那就不可能是一两毫秒的事了。我提个挑战性的问题,就是你刚才说的P99,什么两三毫秒这个事情,如果我就裸表没索引或者轻索引,就一个主键索引,然后我的这个查询就把这一行给查出来,按一个主键把它查出来,我也没有什么wherer条查询,我觉得B不就这么,这样的话,你觉得acle能达到这样的成吗?就算达到了,我也在这个场景下不会用acle,因为这时候你就等于把ORACLE90%功能搁在那儿,不用忘,且用多浪费啊,你觉得高射炮打蚊子了,况且还打不好,你会忘记他的身份了,他本来是干那个事儿的,对吧,今天你要让他去干这个事儿,对,其实就是大材小用嘛,就等于说他可以做很复杂,而且他的大材小用的同时,他的劣势都出来了,明叔提的这个问题啊,还有一个。
18:07
这背景是什么?在10年开始的时候,那时候其实SSD还没有普及,那时候还是SARSSARS盘的时候,它有个问题,随机IO其实不好的那种盘的哈,它随机IO都差的,但是你这种KV的场景是什么,基本上都是随机的,包括我们近两年做的KV存储,我们都会发现,就是如果你用哈希在磁盘上去做,其实也蛮有一些挑战的,所以说可能一个背景还是说当时的磁盘存储介质啊,支撑不了你D延迟的各种随机IO,但是有SSD之后呢,其实我们就看到KV的方案就出来了,像rocks DB这种的,其实都是在那种SSD出来之后去做那种的KV的方案嘛,其实周鹏给我了另外一个启发是什么呢?数据库,就算前面我做完了优化,我在访问盘的这时候的层次数还有点偏多,你让他的主数据盘是SSD还是磁盘,对于Oracle的平时的访问差别不大,为什么差别不大,因为。
19:07
你访问这数据的时候,Oracle都已经把它开启到那个呃内存里了,所以呢,就是如果说你的内存命中率是很好的话,它接的盘的好坏就不那么影响了,但是实际上这个机制放在你那个KV的内层呢,它不成立了,为什么不成立,它一个很大很大,我的内存不可能那么大,所以我不管我怎么优化我的机制,按照Oracle上这个平台的话,它的命中率可能是上不去的,它在磁盘上的hit的百分比是会挺高的,那么既然如此,我要是设计K位的话,我把这层去了,我直接让你全部变成SSD,一个是访问磁盘,我在代码上减少了好多层,但实际上我的效率反而是更高了。后来是这样了,我觉得后来到SSD普及的时候,大家是有一个整个的一个movement,是把所有的这个介质都往SSD上,甚至包括n me上。它简化了传统的。
20:07
西的那套算法,他如果把原来那套的开西的算法再搬过来,他又坏了事儿了,其实谈到看起这个话题啊,大家都有个有一个第一印象就是我故意,但其实我们真正去算这个账哈,它是性价比好的瑞,它其实相当于干什么传统的数据库都有CA系对吧,不过配CA也好,Que CA也好啊,都有CA,那但是呢,它是一个分布式的CA reading是一个什么CA,它是一个集中式的CA,像MY这种啊,叫page CA还是buffer CA啊,就是那个配的比例超过一半,其实这部分都做的这种就拿来做看洗的,然后你现在在每个后端每个节点都去做看洗和集中式的看洗的一个比料,我们看过,就算那个账的话,集中式看洗它的成本要好得多,因为它不会有浪费,因为它严格用你的访问,基于你的访问去做IRU,所以说真正是看起来如果下面你要用一个存储带CA去支撑百万千万G的访问,和你上面用一个CA系,这个CA系可能就是几十G的内存就能够扛你百万千万G的访问量,下面你就配正常就行了,配正常对,为什么瑞这么火你。
21:07
什么它用集中式的开启的方案,然后去代替你原来的这种的分布式的那种单点的一个开启的,这是其实它为什么能够去流行,因为它还是什么一个更性价比高的一个开启方案,但是缺点是什么?他如果一旦崩掉了,然后给你后面整个就崩了,因为它是一个相当于流量防火墙,你今天这种设施上百万的一个吞吐过来,然后全部流量都要靠他来卡,他的命中率就很高,所以说缓存有一段时间很多人用不好,还是个取舍吧,你不可能说做一个大的集群的集中式的开始,像我们现在在内部运营的有上千个节点的威斯的一个集群,就是支撑大几千万级的一个吞吐,但是它要一定是有限的,就是任何的一个集中式,它有边界,从运营的角度,我们不去推荐它这样玩,因为你把鸡蛋放给一个篮子,因为每一个系统还是一个独立的一个耦合系统,一旦这里面有但凡一个问题,你整个系统就崩塌了。所以说它的集中式的边界在于说运营程度的,我的技术程度,其实还好,像楼水口的这种分布式啊,它基本上都是希尔拉省的一个方案,单点故障就单点故障,对影响。
22:07
局部对对,嗯,回过头来说no口这个方向的发展,一个是我们看到缓存出来了,帮这些业务,互联网的业务啊,去扛流量了,扛流量的峰值啊这种的,然后提升用户体验,用户体验也是它最重要的一个贡献。现在的一个业务要求,但凡每一个页面,然后你多10ms,你的用户流失可能就会多3%,我们当时有个客户就跟我提,我们当时的P99是5ms,他会说我另外3ms,我在想你为什么要纠结这2ms 2ms对你一个业务来说真的有那么重要吗?它后面是什么?它业务逻辑,它用户的一个操作会放大成100个指令,然后100个指令每个多2ms,那就变成200ms,它很多还是有一些放大效应,延迟这个事情其实我觉得是恒久的问题,就是非当现今为止最成功的一个库数据库应该还是芒果DB,芒果DB你看它现在已经到10亿美金的年收了,蛮大的了,你看独立的一个数据库10亿美金,那跨过这个坎儿基本上就已经非常成功了,他的一个做法就完全不一样了,他围绕着开发者生态去做的一个方案,那瑞。
23:07
是呢,是一个没有替代的方案嘛,因为原来你扛不住,那必须要有一个缓存方案,那芒果DP它不一要芒果DP,其实你今天去反过来看,它其实也就是传统关系型数据库的一个市场,说白了就是看我们看麦c5.7开始也有杰son,芒果DBT就专门在去做存储这样的一个场景,用Jason这套方案去吸引了那么多的用户过来,而且呢,他用开源的这个方案去开源,最后商业化的去闭环,这个方案其实也非常成功,像开源吸引足够多的用户。技术我们之前在云上做mango DB, 其实有一段时间也很困扰,嗯,很难招芒go的运维,因为芒果在很长一段时间还是一个偏小众的一个数据库,刚开始业务选型的时候用的很爽,非常方便,因为到010年以后,面向对象编程嘛,对吧,这个数据库起来,原来那些什么C啊,这些慢慢拍拍就Java呀,对互联网都不用这个东西了,对都面向对象了,然后芒果面向对象接上就是天然的对象,对吧,对开发者非常友好,我记得二零一几年的时候,那会儿芒果还非常早的时候,我也就用起了。
24:07
反正我就取个代码,取个进程提起来,然后我节省进节省出,对吧,直接转换成了一个代码里面的对象非常舒服,他是我么,开发者的角度吸引,吸引了足够的用户,然后呢,初期可能很困难,但是只要你给他时间,有足够的用户基础,他就能够发展起来,但是这个呢,没有足够的人才支撑他的的,所以说我看到一个阶段呢,就是用户在投随以着,后面我们看到用户的技术,还是有更多的用户在采用,数据库作为一个pass厂商,他去投入重兵去把服务这块做好了,就解决了这个关键痛点,你把服务做好了,稳定性搞好了,那业务就可以继续再采用。所以说嗯,我们在做mango的时候啊,他就经历了大概这么个阶段,他就是面向开发者,生态做得好,但也是这个东西的特性,能够吸引生态,你拿个偶尔好奇,你想吸引生态都难了,对他就抓住了这波程序员,然后我在技术上面的一个趋势的方向,你今天就面向对象呢,我认为他是这个易用性,呃,让你不用太。
25:07
去考虑传统的table啊,Field啊,那些东西,你拿到了Jason对象,它有各种各样的小算法也可以进行处理了,那playation拿到了,我就直接处理这个业务了,然后这个东西要持久了,我就扔进去了,这个是方方便的,我刚开始我问了一下,我们才选用mango的一些客户啊,特别是游戏客户选用了蛮多的,我说你们看中mango哪些点啊,他给我提的时候,第一个点开发时后用起来真的方便,因为他们叠代很快,然后他说scheme历史是我们的首选,选门口的第一个因素对,我不需要,所以今天加个字段,明天加个字段,我还要DB去帮我做变更,不需要去排期的,没错,对,第一个是ski money, 第二个还是就是分布式的,这段是芒果在客户选型的面最核心的两个动力因素,我不知道有没有用芒go写的比较大一点,比较复杂一点的,1涉及到某个模块跟某个模块之间的数据交换,或者是需要一个公开的完整的一个数据字典定义的时候,那你这个ski。
26:07
的这个特性就会处处变成碍手碍脚的东西,会吧,从民俗这个角度,我觉得是两块,开发者用起来很爽,运维的人其实对他不是,他很喜欢,运维的人希望我知道这里面的结构,我希望知道里面是什么东西,所以说运维其实挺不舒服这东西的,之前听过一些做运维的DBA的同学聊,他说今天这个mango里面究竟有多少字动我不知道,我也不知道研发究竟写了没有人知道,因为他他在肉和肉之间都可以不一样嘛,所以说其实mango d BA他也在迭代,它这个collect下其实就是个table,这个table里面数据的字段分布是怎么样子的,它也在做一些东西,这块呢,可能就是一个效率与维护的一个平衡吧,它是一个效率首选,今天你要快速发版,快速迭代的,然后他就对于业务又好,那可能你的维护就要为他妥协,这块我后来想想啊,也不矛盾,为啥呢?如果换了很多年以后,我的应程序的代码,就我指的是个核心程序代码,或者人工智能,或者这计算机更厉害。
27:07
他把这块儿overcome,使得我在便利性上的得到的benefit更多,我不太在乎他跟以前那个的差别,其实跟业务形态有非常重要的关系,比如说我们用关系型数据库,过去写的应用都是一些核心应用,银行啊,电信啊,它支撑业务的应用,现在用这些no c口,或者是用这个网购这样的写业的应用,可能是游戏,我觉得在你写游戏的时候,可能也没有人假想这款游戏会被玩40年,所以说呢,可能这块儿就是互联网的迭代呢,确实会很快,它比较倾向于是能够快速迭代,支持它快速迭代的一些数据的一个支撑的方案,像瑞呀,芒果啊这种就芒go那活,就我们现在在云上,这两年在公园的增长也是蛮快的,技术和生态是吻合的,对,它是开源数据库里面做的应该是最好的一家吧,那芒果DP是真正在商业化,他把自己做到10亿美金的,你看现在做数据库的哈,就S雷它也是非常成功的一家,然后芒果DB也算一家,我觉得。
28:07
还有几个东西可聊的,Spark算是一个曾经亮点的项目吧,嗯,Sparkrk呢,我我们在云上看到了更多,他还是在大数据那个板块里面,还没放在数据库这个板块啊,但是呢,它确实采用的呢,确实蛮多,因为数据库基本上是大数据的上游嘛,在这儿来往下流的时候呢,我们看到的采用确实蛮多,还有就是卡Sandra,说到卡Sandra,其实那天跟民宿简单聊了会儿嘛,数据库的技术啊啊,像农这个为什么会有这么多,对吧,越来越多的数据库出来,农时代表着一个什么,代表着数据库的一个细分,就是随着业务的需求的一个发展啊,它可能不同的场景需要一个更垂直更好的一个解决方案,来我们举个例子,就是以前我们在小时候,家里就只有一口大铁锅,然后蒸,炒什么啊,煮啊,这些全靠一口锅了,然后到今天你去看我们的厨房里面有什么,炒菜有炒菜的锅,煎蒸鸡蛋有平底锅,分久必合,合久必分,你刚才用锅的比喻,我那天用的是刀的。
29:07
比切菜、切肉、剁骨头,然后削水果,都是不同的刀,对吧?但是呢,有一天如果有一个超级工具,你只需要把这东西扔进去,然后他就按那个东西给你扔出来,其实你也不会care说我为什么要用那个刀,对,其实那天跟明叔简单聊了会儿,我下来想了一下这个事儿,我就在想有哪个技术是延展得很开很细之后,最后又被一个技术收拢的。在No这儿有一个方向叫多模数据库,很多大厂都在搞,今天真正去推出多模产品的,或者号称多模的实现方案其实不一样的,但是最终呢,其实可能归根结底它是几个,它还是一个内具的多模,而不是一个外距的多模。我们看到今天最早上线那个多盟数据库是微软az瑞尔的cosmos DB, 而他它是第一个把这个东西搬上线的,那你仔细去看它产品的一个设计理念是怎么样的,再往下是一个通用的存储,再中间是一个计算引擎,然后就各种各样的引擎,再往上是接口,接口呢它是开源协议最终出来啊,他和我独立的做烟囱。
30:07
这的几个产品的区别,对用户来说差别不大,仅仅是内部做了个结耦合对不对?他解决了他自己内部我要做多套存储一个问题,那可能还去解决分布式的问题,看似是一个简单的包装,但还是有意义,人们会被这个买单的,他可以在产品功能理解上面,其实去统一它的概念,统一它的操作逻辑,这样对于用户来说,我的使用门槛低了,如果是一个大公司好还好,我采用6个10个数据库,我能够支付得起这么多人来去维护,但是如果一个中小公司,其实他支付不起的,我我要去每一个场景都招一个DBA来去维护,就实玩不动,但是呢,这种多模的形态的产品呢,那就对他来说,你只需要一个人,只要懂这个产品,那可能大概面不同的引擎嘛,这样是对用户的一个价值,10年还有什么事儿,10年10年还有那个就是别的厂商是个啥事儿呢?就是IBM在2015年把的源代码可以卖给中国的本地企业,这时候呢,就有三家企业,南大通用,这个华盛。
31:07
天成,还有福建的新瑞阁,这三家公司各掏一小目标就买下了information的源代码,但是放在今天其实就很难看到这样的事儿了,是吧,今天是不可能也没有合适的标的物了啊,因为那时候方面上还是有不少客户嘛,像中国人寿啊,PCC啊,什么中国移动网管啊,几个大客户还在上面,那还有啊,浦发,所以这样的话,你要是有这个代码的话,支持一些老客户做做服务干嘛啥的,还是有一定计划,我如果是美国公司,我就都卖,什么叫都卖。你什么时候给我买来买源代码,只要不是当下的你兔之类的,对五年前的我都卖,为什么第一看懂要花很多钱,看懂学会了又是很多钱很多时间,学会了又在上面再进行改造,又是很多钱很多时间,然后能够持续的维护这个版本,甚至发展这个版本,你又要花很多钱很多时间,这是一个不划算的买卖,要生产这个问题呢,就得是碰到国产数据库那个角度去做这事儿,咱咱现在只是说这个15年他发生过这么个事儿,呃,10年其实还有一个,比如小军这边应该比较熟,我们前面聊过那些老牌儿的数据包,到了一年以后,基本上至少在中国市场开始有点销声匿迹了,这个是怎么一个,刚才我也提到哈010年的时候呢,我在IBM的最后两年了,咱们先从IBM开始说,他跟Oracle的rack打了那么多年,终于它是有点力不从心了,一个重要的事情就是Oracle推出X data, 它就是个一体机啊。
32:37
而且是用这个flash cash协助这个硬盘做了cash,还有为词的怎么下推,大家今天在互联网里都在讲计算跟存储分离,但是这个词儿用在X data上就似乎还格格不入,他恰恰是把计算往存储上去会如果争论起来呢,你会发现orac Oracle的X data它不是一个存储和计算分离的方案,但是这块呢,没人管,普通的客户会发现这台机器即便在or TP上也有很良好的表现,也因此呢,咱顺水推舟,就说这个机器很强就完了,我呢正好在一二年有一帮朋友介绍我就跳槽去了Oracle,到那儿呢就去负责X data塔的推广啊,我是在这个技术专团队里头,负责协助这些BD们去开拓市场,做技术方案,我当时加入了以后呢,干啥呢?就需要把一体机推给普通的用户,那这时候就为啥要给大家分享这个呢,跟今天的国产数据库公司呢,你要借鉴。
33:37
那么这个方法呢,咱就把IBM与program那个方法用到orac code子来了,是什么呢?就是你一个一个行业打,每个行业你精准的去准备,你谈的话题,不是简单的我推你个Oracle一体机,而是你现在业务系统都有哪几个啊,都什么什么压力啊,哪几个是最可以换到X列,你跟银行谈,谈的特别具体,哪个东西恨不得他定了以后下礼拜就可以开干了,你的合作伙伴都拿几个,他们的系统都已经怎么怎么着,因此我在前面的这几年呢,其实在Oracle呢,主要就是推X data塔,而且按行业的,我想从技术上打断你一下啊,你卖了这么多X data, 回过头来说,你觉得X data是个好东西吗?是值那个钱吗?就是你要是说按它它的list price, 我是不是值这个钱,我可能会比较迟疑的回答你,因为那个X data是什么,呃,情况呢,它的硬件架构其实是PC差。
34:37
6架购物那个flash卡也不贵,而且你如果按照它的副license去卖,其实在我看来就是天价了,今天你花的钱是硬件的钱,实际上往往这个license上是给你极大优惠了,这样的话你付出的钱实际上是值的。你这个产品的包装,产品的定位以及它的价格,对现在的数据库公司这些大佬们或者是产品经理们有些什么样的启发呢?Oracle X data那个时间点如此的性能超群,虽然是集中式的架构,不是分布式的架构,它不是卖给互联网行业的,卖给银行、电信、政府的,在这样的价构下,用一个质量超群,价格可谈成功案例很多行业里边一个一个的去切,我相信现在的很多数据库公司也是每个人都想能够占领一个行业什么之类的,我的东西壁垒很高,别人打不进来,但是事实上没有,对吧,这个成功怎么成功呢?我认为是他是要回到基础研究的刚才。
35:37
谈到了对位持的下推,X data, 它其实把位持压给了智能存储,另外一点呢,Oracle X data里头智能存储软件既没开源,也没单独卖,但是国内它给你有一个空间,什么空间呢?你要么你是个自研的数据库,你根据我这个原理,你把一些位此也好,把杀也好,你下推到你的一个智能的存储去,当然你还得开发一个智能存储,但是我今天接触过的所有的,我指的所有的国产数据库,它的理念跟这儿不太一样,这个理念呢,实际上挺传统的理念是我的计算下推,而今天我见到的国产数据库一个一个要么把我raft,我计算跟存储分离,总我们感受到压力了吗?感觉到有一种锋芒的冷光,我们这边刚谈完rap,对不是他谈的话题不完全嘛,说我们前面说过好多次,从80年代过来的数据库人从三范式。
36:37
受了满满的三泛式教育的人,现在看skimulless这个事情,就好像没穿衣服一样,但是现在人都不穿衣服,一个小背心就出去的时候,然后他觉得你你动不动就穿个大棉袄,这事儿也很可笑,不完全是这样,你说多毛也好,或者说这个东西也好呢,我觉得跟一体机呢不矛盾,我今天看到的或者我不屑的那些一体机,并不是因为你把好东西搁在一起,它多磨了,而是就作为一个普通的数据库,你提供的一体机跟我自己拿机器装它没有区别,但是你用X data是你自己搭机器装不出来。刚才郑老师在说一体机的时候,我突然就有个灵感碰撞出来了,因为我我们现在在谈云数据库嘛,其实云数据库经历了两个阶段,第一个阶段呢,就是数据库上,云就是开源的上品,第二个阶段叫云原生数据库,其实今天云原生的数据库的思路就跟郑老师说的一体。
37:37
也是非常像的一个思路,怎么来说这个事儿,国内云数据库的两个阶段,简单聊了两句啊,第一个阶段呢,就是在做云企业自己的技术拿到云上的拿出来卖,然后呢以开托管为主,所以说你看到今天的云数据库啊,基本上以开源为主,比如说red mango mysq啊,PG啊一系列的托管。第二代呢,就是我们可说的云原生数据库,云原生数据库我们看到讲的最多的是存在分离,Rapft呢,还是一些底层的,就是最核心的是存在分离,但是其实今天我们跟括在看我们云数据库在做的事啊,它可能一体机的思路很像我,我举个例子,今天我这边的数据库他们在做些什么事儿,这个存算分离是一个嘛,存算分离是把计算和存储摘开,这个摘开的的一个作用呢,是解决成本的问题,最后这些成本的下降啊,然后后会反馈给我们的企业,这是有国内背景的,是因为我们在物理机上去装数据库,后来大家都会面临这个问题,计算和存储的售卖率匹配不上,像海外的为什么要去做存转分离呢?它的原因是解决性能不足的问题,你看国内跟海外的他们两个机做存转分离的出发点还不一样,但是呢,殊途同归,最终都要走到用云的技术。
38:37
就是在云上做数据库,跟那个一体机很像,就是如果你我仅仅是把数据库搬到云上来,客户之间和客户买一个VMWAR来去搭数据库,有啥区别啊,没区别,第一代云数据库你看到没有很强的竞争力,我记得三四年前,当时我估计啊,有接近一半的客户在云上之间数据库啊,我们当时最主要的竞争对手不是友商,所以是自建做虚拟机自建,他觉得你今天你不是也是拿个开源的税库来托管嘛,你的内核也没有大改动,说你用你有什么好处了,所以说可能我们会不断跟他讲,我们有大规模的运营经验,我们踩了多少坑儿,他说客户相信我招几个人我可以搞定吧,说白了还是因为人便宜,人贵了以后,他就愿意相信有一帮专业的人做了以后,我只用他的1/10的的人力把我这个事儿就捎带这给照顾了,因为当时很多公司都感觉我自己要做大嘛,要技术自强的,我要招一个DBA,甚至我要招这些数据库的内核开发,我要做自己的版本,归根结底啊,那句话叫做我也要造个轮子,所以看来我是比较心态年轻嘛,TVP不是有发代金券大概。
39:37
我租一个轻量级哦服务器,我现在就用这个代金券,常年租的两个东西,一个是买c code的pass,另外一个就是个轻量级的Linux OS, 我是要去鼓励专业的人做专业的事,也就是这个数据库不要我再去折腾了,我就交给一个pass,他给我提供一个标准服务就行了,那真的是这个想法,这两年啊,就慢慢被接受了,就是说这两年pass的采购率非常高了,我所以说为什么会有这样的变化,这个变化就是什么,我们从最为刚开始的前面两三年,先把这些开源托管搬上来做一个管控,这个事儿搞完之后呢,那就要做核心竞争力呢,这核心竞争力的思路是什么样的?它是一个立体式的,不是说我围绕着内核去做,围绕着某一个管控功能去做,而是整个全站的,怎么理解这个全站,比如说我们在做release的时候,我们跟网络一起商量,把中间的这种,因为集中式的给的位带来了一些集中式的问题给解决掉了,所以我们的延迟大概降低了30%,吞吐的话还有提升,我们在和OS团队一起做内存压缩,进一步的降低成本,我们去和计算网络存储OS。
40:38
就全站在一起去配合,这个时候跟刚才郑老师说的一体机思路是不是一样,您讲的这个事情呢,我在Oracle经历啊,提出一个就是我的观察跟现在的好多人的观点可能会不一样,2016年之前,X data在Oracle就叫做数据库一体机,但是2016年之后,他把X data称为Oracle数据库云服务器,它是啥概念?就是说我今天可以什么虚拟化都不做,我就拿一容量大一点的unix机器,让它挂上这个盘阵,这台服务器上,它运行了很多套Oracle,但是呢,我这台机器不允许你用户登录到我unix操作系统上,我这机器上会有一个云的pass的管理平台,对外服务,也就是你今天通过pass给的一些操作协议,你登上来,你可以在我这儿申请一个数据库,关了数据库加资源调。
41:38
参数等等,所以呢,我这台机器装好了,这东西弄完了,我不允许你登录操作系统,这台机器是我的云服务器,所以你要知道Oracle是这么干的话,有些人会说Oracle投机取巧,Oracle其实压根儿就不是云,他是拿了一个传统的X data, 放了一个云服务的pass服务给了你了,Oracle的云都是这么干的,我一直觉得咱们今天聊那个10年的时候啊,Oracle的云话路径是比较曲折的,包括现在的实现,这个实现我认为很多真的玩儿云的人,他是不同意的,不喜欢的,对吗?你也不喜欢吧,但是我想说个什么事儿,你乍一看不喜欢,但实际上你真的要见个私有云企业内的,你这干啥?你买我这一台机器放在墙角,基本上把你云里的那个数据库的service就囊括了,你的花的钱是最少的,少了你花了200万,这事儿就不是这,这就好像吃菜的口味一样,有人喜欢咸,有人喜欢酸,有人喜欢辣,有人喜欢淡,没有人可以。
42:38
强制要求你Oracle必须要做什么方式去做云化或者做云服务,最终的检验标准是市场,我是这么看的啊,Oracle云化路径走的很曲折,一直没出来,如果是一家大牌的数据库公司,它会用一种你看的很原始的方式,这种情况下它的pass是能提供的,不是其实我我觉得这里面有一个很重要一个点,大家提云化的时候,和我们90年代谈的云计算和集群计算、网格计算都不一样,这个时代云是认真和真实的多的云,所以我记得在10年代有一个很大的冲击啊,在之前的这个老牌的数据库公司,Oracle也好,IBM也好,Cybas也好,Microsoft也好,忽然间就在不经意之间发现自己不是数据库的leader,在云时代不是数据库的leader,数据库的leader,大家谈的全都是AWS的aurora Google的spner都是谈的这些东西,所以云数据库整个的给人们又是一次颠覆性的方法论的思考。
43:38
整个这种时代的这种movement本对Oracle一定是不友好的,因为你的包袱重,就像你说的,你能用X data那个概念拿它去做了云服务器了,这都已经算是你拧身拧过来了,但是你拧过来你身上的伤痕痕迹也都在,我的意思就是说你仔细想一想,如果你今天织了一台比较大的PC服务器,我在上面接着裸盘直接上了马锡Q,其实这个就是马锡Q访问我这个只直挂盘的话,这个效率是没问题的,那么我的看了一下,我根据这个负载,我发现我这台机器呢,平时应对十几个客户来向我订阅,怕是是可以的,那我其实不去做咱们今天互联网公司那么费劲的那么多事儿啦,我做一套管理器,我不让你登录我的操作系统,我自己给你的这个pass接口,把我的管住不就完了,我明白,但是你不得不说你这个概念是落后的,就是有的时候你拿个落后。
44:38
概念不见得,在商业上你没有空间嘛,但我我理解沃尔可的云跟我们现在看到公有云的差距,这么就差别,差别蛮大,大的不是一个公有云的一个核心的理念是什么是磁化所有的资源,磁化公有云啊,因为我们的用户规模体量在那儿,就是像MYSQL这种数百PB级别的一个资源在那儿,我们为什么要去做那种纯算分离,为什么要去做磁化,就真正的要把计算和存储拆出来,但凡比如说我下面的存储售卖率、装修率只能卖到50%,假如说是500P,我把这个拆开之后,我另外能释放出来500P的资源,这500P的资源一个月就是可能大几百万上千万的一个成本。所以其实对云来说,他做的这个事儿的核心动力是什么?是成本,是要把所有的资源完全给磁化,每一个资源的磁化,把它的成本压缩到极致,因为我们解决的是大规模体量的问题,还不是说单个技术的问题,所以说会发起云原生的运动,就是因为要去解决大规模的。我觉得现在的云的数据库的。
45:38
一个核心特点让我说啊,就是千手观音,你可能有1000个手,还有1000个脚,当你需要就两只脚上面带1000个手的时候,你就两只脚一带1000个手出去,但是听小军这样聊的呢,Oracle就是每一个都是一个小人儿,这小人儿都是两条腿,两个胳膊,一个脑袋,是按照这个战斗力,我最优战斗力来给你配的,你也别跟我说,到那时候我不需要你的手,我只需要你的脚,那我这手也带过去,是这么个概念。其实是坦率说啊,我觉得Oracle这个solution跟00年代的那个时候SH2DING那些异曲同工,没有根本的区别。我刚才也说了云时代,其实这个大家都注意到了,亚马逊、谷歌忽然间变成了数据库的,至少是在云时代的数据库的王者,你看过去几年可能在got特、ner forest塔这种的魔力象限里面,其实你看到云场上已经往第一象限走了,像微软也是,微软很典型,就是2014年撒切尔上任以后做的这个战略转型。对其。
46:38
就是他在云那儿的业务转型其实蛮成功的,Oracle Larry aisson, 您还记得,实际上在一三年之前,他其实是对云不感冒,甚至于公开场合他说,哎,我都不知道贝佐斯他们在干啥,后来他才意识到这个云的渗透力有多强,上云的人有多多,所以你从外观上看,Oracle呢,突然间他就又投投入云了,而且这个时间呢,他就给我感觉,给大家感觉有点落伍,这是感觉在Oracle内部,像我以及旁边几个同事是不怎么特别赞同Oracle扑向云的方式方法的,为什么是不赞同它扑向云,还是不赞同它扑向云的方法,这两个因素都有,也就是说作为基础软件厂商,实际上这类厂商之前几十年的业务模式。
47:33
是属于轻资产模式,轻资产的公司,你今天要去做重资产的事儿,也就要自己去建立,这个就是云中心,其实你要做好准备,你会大量亏本,你会可能好几年回不来,这是有可能的,你跟亚马逊不一样,亚马逊的机器本来就有,对吧,它可以外溢,但你其实是没有东西可以外溢,要实建的,这个就是我刚才说的,体现了微软的牛逼之处,人家就是要赌你砸不起我,是的,那这个呢,就是说咱们所谓的反对的意见,或者觉得,哎对这个事儿担忧不看好的事儿,第一从这儿来的,第二个这件事情,假设Oracle呢,确实自己也不再做Oracle的云了,但是呢,他跟谷歌,跟亚马逊,跟这些厂商谈好,他的license,跟这个厂商进行一个谈判,也就是你在AWS上可以随便去订阅。
48:33
克Le的服务,那么Oracle呢,公司呢,挣Oracle软件的一笔钱,亚马逊去挣他的爱斯的这个层面的这个分成,这个呢不一定不是一个经营模式,但是这个经营模式应该是Larry Alison不肯的,他一定要是自己去建东西,这个跟他肯不肯没有关系,为什么老人家帕是第一象限,你是在第一象限下边,你不要说你有无数的客户离不开我的数据库,所以我的RDS在你上面一定会卖的很好,那是你一厢情愿,这个一厢情愿呢,我个人哈,照今天看可以一厢情愿挺长时间,因为今天在美国本土,Oracle是不给这个AWS和这个谷歌去颁布颁发,这个就是云上的license的,我觉得Larry森同志的话叫做听其言,观其行,他说的和他做的往往不是一回事儿,你就说他对云,对云计算这个事情来说,2013年他一直在。
49:34
批判这个事情,但是你怎么不说一九九几年的时候,他是最早拥抱什么NC,最早拥拥抱这些最早的云计算的那一波,他拥抱完了以后被咬了,他没成功,走早了。邹鹏能不能够从10年代,比如说呃,像中国的这几大云商啊,他们的各自的数据库的产品系列,或者是产品服务发展的路径给大家做的回顾,云数据库的发展就两个阶段嘛,第一个阶段呢,就是上云,先云上把云数据库托管起来,这是第一阶段,然后呢,托管就以开源为主了,在1718年左右吧,就托管那个事儿呢,基本上已经差不多了,那剩下的就是打磨了,云厂商呢,在考虑一个事儿,就是什么,怎么去更进一步的去把数据库这个技术,然后在云上它的优势能够发挥的更明显,就是所谓的这种刚才的共享经济模式呀,这种云的模式下来,能够把数据库做的更好,更贴合云的场景,所以说就产生了云原生数据库这个概念。我们看到这几年。
50:34
当是在卡塔纳尔魔力各种的for瑞斯魔列象限里面,其实提到最多的也是云原生数据库这词儿,奶奶源提出来的,我记得大概就是在17年欧若拉推出来的时候,慢慢就开始有这个概念出来了,在云上原生长出来的数据库,但是这个精确定义是什么呢?什么叫做云原生数据库呢?其实有好几个解释哈,我们认为的一个版本就是什么在云上长出来的,为云上这个环境而去生长出来的一个数据库,在云的环境,根据云的需求,然后去做了演进,这是一块儿。还有一些理解呢,就是云原色数据库,就是它把那个磁化那个事儿加强了,那就是存酸分离,我觉得应该是这个概念,有可能也是在一直迭代中,存算分离啊,弹性伸缩啊,然后这个管理的平台啊,分布式啊等等这些东西,最近大家一提到云原生都是跟K8S做一个强关联的,所以我不知道适合不适合在10年代聊这个事情啊。
51:32
数据库上K8S可能大概也就在10年的末尾的时候开始了,有一这有一场这样的运动,然后呢,最近这两三年已经大家都是基本上是板上钉钉的事儿了,就是我了解到国内的几个厂厂商啊,在数据库上K8S这个事儿上,都是这两年以运动的方式来去推进的,而不是说一个自然的演进运动的方式什么意思,以运动方式就是整个战略都指定在这儿,今天数据库就必须要上,上云院上,定期限期把数据库挪到云员身上,你公司内的一个战略运动是吧?对,他可能变成了公司一个战略了,数据库必须要上云,但是还是还是那个问题,就是说数据库必须上云和必须是云原生和必须是K8S,这个三个概念是不是划等号,可能几年前呢,K8S的技术没有那么繁荣的时候,还有一个不确定性,但是在这两年已经画上等号了,就是你除了要上S以外,我们现在在内部的一个策略就是你还得上K8S。小军一直对。
52:32
K8S跑数据库有有一些有一些不同的看法,上海话讲,呃,罗蛳壳里做道场就是一个很小的房间里,你要去干特别特别复杂的事情,我顺便说一下,为什么现在云厂商对数据库上K8S这么坚决啊,这个事儿因为他的视角还不一样,像我们腾讯云数据库,你现在拉开列表十几款数据库,你现在的work你就做一个嘛,我们有十几款数据库,每个数据库就算有些数据库收入很小,但是客户要啊,我们要保证这儿服务的全面性的时候,能解决客户问题,我就要把这十几关数据库长期维护。所以说像K8S它的编排能力在这儿就起到更大的作用了,我一套编排语言能够把所有的数据库的资源编台都拉拉管到一起,这是它的一个魅力,那今天如果有K80这种编排技术,我就能够搭建一个数据库的中台了,就是数据库的管理中台,这个管理中台它就集中似的,能够对小产品就特别友好,假如说我们去做了一个很长尾的一个数据库,假如说就像持续,它就是一个垂直场景的,它不是说。
53:32
所有的用户都用产品迭代就赶不上,那就是会把整个产品的那个迭代就拉,就是拉的很长尾了,但是如果今天用同一套编排的技术,能够把多个数据库横向拉管起来,任何一的迭代,我所有的数据库都能够享受这样的一个技术的演进,这是在云厂商的角度,它就会有这样的一个好处,就是什么通过统一的编排语言来去纳管所有的产品,而是管理角度,它不是不一定是纯技术角度,它是运营角度。
54:00
2010年最后一个该聊的话题叫做去ioe,这个也是从一个公司的运动变成了全国性的运动,通过的infrastructure里边要把Oracle的痕迹去掉,把EMC的存储去掉,把IBM的服务器去掉。坦率的说,我认为最后证明最难去的是Oracle,阿里不难,重石油难,但是即使你说阿里不难,也花了相当多的人力物力去做这个去欧的动作,也是一个不是一般的公司可以付得起的成本,就可能像刚才明叔说的,我觉得不同的用户用的深浅啊,不一样的时候,可能代价不一样,我认为阿里提的去ioe的时候,他以这个成本的因素,它并不是意识形态,它以这个经济的这个因素更多一些,Ioe正好就是三样比较贵的东西,IBM小型机,偶尔。
55:01
数据库,还有这个就是EMC存储,这个原先都是这里头花钱最多的这三样东西,其实我觉得这里边还有一个很重要因素,就是以Oracle为代表的传统的关系数据库,在那个时代的数据量和应用的特征来说,它是不适应的,所以对阿里来说,实际上不光是存在一个成本的问题,它还存在一个架构正确性的问题,所以我我觉得我觉得这是有事了,对,有技术,有业务,这个是凑成了这么一件事情,互联网用开源,这是天经地义的事情,很少有互联网去用传统商业上的产品,因此呢,就是去Lee,我认为是去的对,是OK的,尤其像那个互联网公司,这是无可厚非的。我们把前边2010年代中国数据库的发展,从大数据席卷市场,从各个这个大数据的产品出现在互联网行业里边,包括老牌的数据库的一些发展路径也讲。
56:01
讲到了云数据库的这些pass产品的这些出现端倪,然后也讲到了去ioe这样的一些运动的兴起和阶段性的成功,那么我们非常高兴大家能够一直收看我们的节目,我们下一期我们会讲到中国20年代的百魔大战,百酷大战,非常的精彩,欢迎大家持续的关注语音数据库了,My circle post green啊芒果MY吧,去ioe沃尔就是中国就哈多那个大数据那块冲击kind数据库的一个诞生的一个崛起吧,阿罗拉开启的云算分离的价格,适应我移动会啊时代业务特征,大家对于性能的要求,对实质性的一些要求,成本低,大部分都开源,硬件到一个瓶颈了,可托管的搞弹性读写分离,可扩展啊容灾可运维,传统数据库部署比较麻烦的,极大的降低了这些各个用户的成本弹性。
57:01
托管如水分离,高可用还是更加容易去誉为轻量级的高可靠、高扩展性,低成本和扩展性高可用,避免一些重复的一些建设微服务容器化弹性。
我来说两句