作者介绍
孙垚光:目前是百度分布式计算方向架构师,离线计算技术负责人。2009年加入百度,先后从事内核网络协议栈、Hadoop/Spark大数据等方向的研发和优化工作,对Hadoop大数据生态有较为深入的理解,积累了丰富的大数据实战经验。
本文主要介绍百度基于Spark SQL构建的一体化即席查询平台,包括架构、特点、相关概念,以及其中涉及到的主要关键技术点,并选择其中一两个技术点做深入分析和探讨,接着是即席查询平台在百度内部业务上的应用案例,包括使用场景和业务收益,同时,面向百度开放云的企业客户,我们也即将推出此类产品,以满足企业客户的大数据查询需求。最后简单介绍下后续规划。
来源:hadoop博文技术