前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >数据模型的战斗(1):被遗弃的老陈

数据模型的战斗(1):被遗弃的老陈

作者头像
用户1564362
发布2018-04-08 11:51:33
8001
发布2018-04-08 11:51:33
举报
文章被收录于专栏:飞总聊IT飞总聊IT

数据库圈对不起老陈

2015年美国某牛逼教授,ACM和IEEE双院士(此处隐去名字)在印度召开的VLDB上说,数据库的圈子非常的不厚道,自娱自乐,只看重自己圈子里的人。对不起一些为数据库做出巨大贡献的人。比如说Patrick O'Neil,又比如说彼得陈。

这两个人,前者发明了一个叫做LSM tree的数据结构。大凡今天工作在大数据领域的人,如果不知道这个东西是什么的话,那的确有点不好意思说自己是做大数据的了。其他不懂LSM tree的可以看看这个发展史。

第二个彼得陈,就是今天我们这篇文章的主角。

先聊聊德布罗意

每次我看到老陈的经历,都让我想起那个著名的物理学家德布罗意。就是那个提出波粒二象性并获得诺贝尔奖的德布罗意。

德布罗意的出名在于一段不实的八卦。德布罗意家族是贵族,但是他却无心社会科学研究投身于物理学。

八卦上说他为了拿个博士学会,就写了一两页论文稿,里面提出了波粒二象性的观点。但是这个论文发不出来无法毕业。

于是他的导师就寄给爱因斯坦求帮忙。写给爱因斯坦的信里说我有个学生是个贵族,想弄个物理学的博士玩玩。你要是不介意就帮忙审稿,等你以后过来玩他可以款待你。

于是德布罗意就用两页手稿混了个PhD然后因此拿了诺贝尔奖。这个八卦当然有人辟谣了。但是不妨拿来对比一下。

而我之所以在彼得陈的故事里提这个人,是因为彼得陈的经历颇有异曲同工之处。一篇论文吃了一辈子。荣誉等身。

老陈是谁

数据库界的名人很多。比如有Jim Gray。比如有Michael Stonebraker。计算机界的名人更多,从图灵开始一路往下数,数不过来。

但是成名于数据库界,却被整个数据库圈抛弃,然而在数据库圈外赫赫有名的可能只有一位,就是这个老陈。

老陈名叫彼得陈(Peter Chen),中文名陈品山。生于1947年,如今也是高龄了。在我讲老陈之前我想问一下各位做数据库的,你们有谁知道这个人吗?

老陈网上的照片不多,我只找到了这张。

老陈1973年从哈佛大学拿到了计算机博士学位。之后进入MIT做助理教授。一做就是4年。然而在MIT没有拿到终身教职。我们只能说MIT有眼无珠。在MIT这四年期间,老陈在数据库顶级杂志ACM TRANSACTIONS ON DATABASE SYSTEMS 上发表了一篇他吃了一辈子,给了他数不尽荣誉的论文。

1978年,被赶出MIT的老陈后来去了加州大学洛杉矶分校做副教授,更奇怪的是他混进了管理学院,而非我们通常认为的计算机系。

等到1983年老陈就在路易斯安纳州立大学安家,这一安家就一直到他退休了。老陈获奖无数,荣誉无数。此外他还是IEEE, ACM,AAAS等诸多机构的院士。而且还有两个以他名字命名的奖金设立。然而,整个数据库圈子却没有给老陈一点奖励。而成名于数据库圈的彼得陈,也渐渐的和数据库圈渐行渐远。

发明LSM tree的Patrick的贡献直到自己退休,BigTable兴起,才被广泛承认。但是老陈不是,老陈的贡献在数据库圈以外是得到了广泛而巨大的承认的。老陈到底干了什么呢?

数据库入门101

我们几乎每个人都是从数据库的某本教材开始学习的。数据库的教材开篇第一讲必定是非常经典的实体--关系模型,也就是ER模型。

比如说我们可以有一个学生选课系统。这里面需要这样几张表:

Student(studentid,name,etc.)

Course(courseid, courseName, etc.)

CourseSelect(studentid, courseid)

其中Student和Course是实体,CourseSelect是关系。我们还知道所谓的关系有1对1,1对多,多对多。

下面是我从网上随便找的一张ER图,我想学数据库的人都非常熟悉了。

但是我们知道ER图和关系代数是两回事。关系代数里面的关系其实是表。也就是说在关系代数里Student, Course,CourseSelect都是关系,没有实体一说。而关系数据库是构建在关系代数上的数据库,和实体--关系模型没有半毛钱关系。但是不可否认的是,几乎每本书都从实体关系模型开始。

老陈的贡献

1976年老陈在数据库顶级杂志ACM TRANSACTIONS ON DATABASE SYSTEMS 上发表了一篇论文,标题如下:

The Entity–Relationship Model – Toward A Unified View of Data

没错,老陈的贡献一句话概括:他是实体-关系模型的发明人。

实体--关系模型,和关系代数一样,也是一种给数据建模的方式。和这个等价的还有面向对象的数据建模观,Data Cube等等。

老陈的这套体系,在和E.F. Codd的关系代数PK中死掉了。但是因为老陈这套东西非常通俗易懂,而关系代数是个很难懂的东西。所以现在大家在介绍关系代数之前,先介绍老陈的实体--关系模型。

实体--关系模型不仅仅在数据库圈子里面获得了巨大的成功,也在数据库以外的圈子,比如软件工程,CAD等领域大放异彩。

但是不知道是不是因为数据库圈子里面的人觉得老陈这个东西和关系代数格格不入还是因为什么,总之老陈本人虽然自诩数据库领域的研究者,数据库领域的那些山头,却从来没有给老陈多少荣誉。

好在世人眼睛还是雪亮的,老陈的贡献在数据库以外的圈子得到了广泛的承认。不管怎么样,能和关系代数PK还好好的存活下来的,老陈当属第一人。

我觉得数据库的圈子的确对不起老陈。要不是老陈的实体--关系模型写在数据库教材的第一章,很多人一开始就被吓走了。凭着实体--关系模型,老陈对数据库圈子的贡献,拿图灵奖可能是少了点,拿个SIGMOD终身成就奖怎么样都是应该的。

可惜了老陈。开挂的人生敌不过数据库圈子的抛弃。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-03-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 飞总聊IT 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档