Google停用MapReduce,高调发布Cloud Dataflow

Google已经停用自己研发的,部署在服务器上,用以分析数据的MapReduce,转而支持一个新的超大规模云分析系统Cloud Dataflow。

MapReduce一直是服务器集群上做并行分布式计算的一个非常受欢迎的基础架构和编程模型。它是被广泛部署并已经成为很多公司商业产品的大数据基础架构平台Hadoop的基础。

但是近日,这项技术已经不能处理谷歌想要分析的大量数据。技术基础设施部高级副总裁UrsHölzle表示,一旦数据规模达到数PB级字节,处理起来将变得非常困难。

我们已经不再使用MapReduce。”Hölzle在周三于旧金山举行的谷歌I/O大会上发表主题演讲时表示,公司已经在几年前停止使用这个系统。

Cloud DataFlow,将作为一项服务提供给使用它们云服务的开发者,这些服务并没有MapReduce的扩展限制。

Cloud Dataflow是这近十年分析经验的成果。”Hölzle说,它将会比现存的所有的系统运行的更快,更易扩展。

“这是一个完全托管服务,它可以自动优化、部署、管理以及扩展。它使开发人员对批处理和流媒体服务能够使用统一编程轻松地创建复杂的管道。“他表示。

所有这些特点,谷歌认为在MapReduce上无法完成:很难迅速获取数据,不能进行批处理和流处理,而且经常需要部署和运行MapReduce集群。

Hölzle在展示会上也宣布谷歌云平台上其他一些新的服务:

  • Cloud Save是一个API,它使应用程序能够在云中或其他地方保存单个用户的数据而不需要任何服务器端的编码。提供App Engine的PaaS用户和提供Compute Engine的用户都可以利用这特征构建App。
  • Cloud Debugging简化了筛选出部署在云端的多台服务器中的软件缺陷的过程。
  • Cloud Tracing提供了不同群体(数据库服务调用,例如等待时间)的延时统计数据以及分析报告。
  • Cloud Monitoring是一款与Stackdriver(谷歌5月份收购的一个云监控初创公司)集成的智能监控系统。该系统监控云基础设施资源,如磁盘和虚拟机,还有一些为谷歌提供服务的服务等级以及十几个非谷歌提供的开源软件包。

编译/晓晓 审校/魏伟

摘自:CSDN

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2014-06-30

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏叁金大数据

数据库和数据仓库你应该知道的

Hive作为Hadoop生态圈重要的一员已经被我们所熟知,它作为一个基于Hadoop的数据仓库工具,用来做离线的数据分析工作。那么什么是数据仓库,它与我们经常使...

1352
来自专栏风火数据

你可能不知道大数据开发的10个技巧

“当你不创造东西时,你只会根据自己的感觉而不是能力去看待问题。” – WhyTheLuckyStiff

1153
来自专栏Java架构

架构的演进,阿里资深Java工程师表述架构的腐化之谜

新技术层出不穷。过去十年时间里,我们经历了许多激动人心的新技术,包括那些新的框架、语言、平台、编程模型等等。这些新技术极大地改善了开发人员的工作环境,缩短了产品...

43610
来自专栏原创

如何打造100亿SDK累计覆盖量的大数据系统

作为推送行业领导者,截止目前个推SDK累计安装覆盖量达100亿(含海外),接入应用超过43万,独立终端覆盖超过10亿 (含海外)。个推系统每天会产生大量的日志和...

3889
来自专栏about云

企业生产环境为什么选择使用Cloudera Manager

看到About云中很多成员,特别是初级入门Hadoop成员,当然也包括已经工作的成员,经常会遇到Cloudera的问题。About云邀请了鸟叔,一线资深大数据工...

1833
来自专栏腾讯云数据库(TencentDB)

腾讯云数据库智能化海量运维的建设与实践

作者介绍:鲁越,腾讯云数据库架构师团队负责人,主要负责腾讯云数据库MySQL、Redis、Oracle等数据库售前架构、运维、调优等工作,曾就职于网易和尼比鲁。

1.1K37
来自专栏JAVA技术zhai

架构的演进,阿里资深Java工程师表述架构的腐化之谜

新技术层出不穷。过去十年时间里,我们经历了许多激动人心的新技术,包括那些新的框架、语言、平台、编程模型等等。这些新技术极大地改善了开发人员的工作环境,缩短了产品...

49112
来自专栏程序员互动联盟

【专业技术】编程老手如何化解棘手难题

依然记得上一节编程课的时候,老师说过一句让我一直到现在都还记得的话“只要是软件,就一定有bug;只要是软件,他的功能就是有限的;功能越强大的软件,他的问题就越多...

3395
来自专栏四蛋科技

驱动大数据的技术发展

据估计,每天会创建2.5百万兆字节的数据,我们需要将这些前所未有的大量数据妥善储存以便日后访问以及对其进行分析。这些数据量大到需要使用鲜为人知的单位来衡量,如Z...

2684
来自专栏TEG云端专业号的专栏

海量存储第一弹 - 自动化运维

架构平台部(后面简称架平)承载的业务涵盖了腾讯主要的海量存储、CDN场景,譬如微信聊天图片&视频、朋友圈图片&小视频、空间相册图片&视频、腾讯视频点播&直播、腾...

5264

扫码关注云+社区

领取腾讯云代金券