采访嘉宾:Michael Stonebraker 麻省理工学院客座教授,2014年图灵奖获得者,美国计算机协会院士
采访视频:http://www.csdn.net/article/2015-12-21/2826528/7
采访文字实录
CSDN:您当初为何选择数据库研究作为自己的职业,并且在这一领域探索了五十多年,直到您现在已经七十二岁?
Michael Stonebraker:你让我看起来比我真实年龄要大咯!并没有五十年,而是四十四年。先来说我为何选择研究数据库。我是密歇根大学的博士,我的博士论文是应用算法研究。早在我完成博士论文以前,我就觉得这不是一个值得投身其中的领域。所以当我来到加州大学伯克利分校,担任助理教授时,我必须立即选择其他领域,必须发表一些论文才能拿到终身教职。而我选择数据库研究的原因其实只是当时伯克利的教授 Eugene Wong 建议我阅读 Edgar F. Codd的论文。我们就这样开始研究这个领域的论文,一切都是机缘巧合,而非我自己的计划。
CSDN:我们知道你是数据库系统之父。目前你的研究重点是什么,以及你为什么认为它们是重要的问题或领域?
Michael Stonebraker:我目前最关注的领域是数据集成。我很喜欢的一个例子是 Groupon公司,他们也在中国开展业务,他们正在开发一个全球范围的小企业数据库,就是把一万个独立的数据来源进行结构化汇总。传统技术的数据规模大概是十到二十个数据,所以网络集成商都面临严峻的数据整合挑战。企业越来越希望把更多独立的数据来源——也就是信息孤岛——整合起来。所以这是一个亟待解决的现实问题,我们目前就在寻找解决方案。
CSDN:在你所从事的研究领域,有哪些尚未解决的重大问题?
Michael Stonebraker:这样的问题太多了。首先就是处理大规模数据库的标准方法,也就是让你的程序在越来越多的计算机上运行。但是,很多问题都需要同步才能进行。在我的领域里,交易处理就需要大量的同步化操作。关于如何有效地做到这一点,虽然现在的想法不少,但是还没有一种确定的解决方案。另外一个问题就是如何对待即将出现的新硬件。新型存储器就要问世了,我们应该如何运用它,现在还是一个开放性问题。关于如何高效地运用图形处理器(GPUs),想法也很多,但仍然尚待解决。如何处理日渐增长的数据库规模,也还未能解决。以及复杂性分析,也就是,很多人预测数据科学将替代商务分析,即进行分析的标准做法。事实上,数据科学包含机器学习、预测性建模、数据集群、神经网络等技术——它们都是基于RAZE的,而非工作台活动,所以如何将复杂性分析和数据管理整合起来,也是一个有趣的议题。所以我认为,尚待解决的问题非常多,数据管理领域就有不少。
CSDN:今天,许多大学生都是二十岁刚出头,而他们中有些人将来也会变成研究员。如果您能进行时间旅行,您会给当年二十刚出头的自己什么建议?您会对您自己说什么?
Michael Stonebraker:我认为,对于即将毕业的同学来说,明智地选择一个合适的论文导师是非常重要的。合适的论文导师至少要具备以下两个特点:一是帮助你选择正确的问题作为研究对象;二是他能够帮助学生在合理的时间内完成论文。但是,在我读研究生的时候,我的导师没有符合这两个条件,正因为这样,我毕业之后不得不改变研究领域。所以一定要明智地选择论文导师。第二件事情,是决定自己是从事学术研究工作,还是投身实业。我的理解是,在中国,投身实业的收入水平会比从事学术研究高出一倍。在美国,两者的差距并没有这么悬殊,不过可以肯定的是,投身实业会挣得更多。对于大学生而言,时间久了,实业工作会比学术研究更有吸引力。所以要看你在学业结束时,究竟想要什么。