前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Google停用MapReduce,高调发布Cloud Dataflow

Google停用MapReduce,高调发布Cloud Dataflow

作者头像
大数据文摘
发布2018-05-21 16:55:52
1.1K0
发布2018-05-21 16:55:52
举报
文章被收录于专栏:大数据文摘大数据文摘

Google已经停用自己研发的,部署在服务器上,用以分析数据的MapReduce,转而支持一个新的超大规模云分析系统Cloud Dataflow。

MapReduce一直是服务器集群上做并行分布式计算的一个非常受欢迎的基础架构和编程模型。它是被广泛部署并已经成为很多公司商业产品的大数据基础架构平台Hadoop的基础。

但是近日,这项技术已经不能处理谷歌想要分析的大量数据。技术基础设施部高级副总裁UrsHölzle表示,一旦数据规模达到数PB级字节,处理起来将变得非常困难。

我们已经不再使用MapReduce。”Hölzle在周三于旧金山举行的谷歌I/O大会上发表主题演讲时表示,公司已经在几年前停止使用这个系统。

Cloud DataFlow,将作为一项服务提供给使用它们云服务的开发者,这些服务并没有MapReduce的扩展限制。

Cloud Dataflow是这近十年分析经验的成果。”Hölzle说,它将会比现存的所有的系统运行的更快,更易扩展。

“这是一个完全托管服务,它可以自动优化、部署、管理以及扩展。它使开发人员对批处理和流媒体服务能够使用统一编程轻松地创建复杂的管道。“他表示。

所有这些特点,谷歌认为在MapReduce上无法完成:很难迅速获取数据,不能进行批处理和流处理,而且经常需要部署和运行MapReduce集群。

Hölzle在展示会上也宣布谷歌云平台上其他一些新的服务:

  • Cloud Save是一个API,它使应用程序能够在云中或其他地方保存单个用户的数据而不需要任何服务器端的编码。提供App Engine的PaaS用户和提供Compute Engine的用户都可以利用这特征构建App。
  • Cloud Debugging简化了筛选出部署在云端的多台服务器中的软件缺陷的过程。
  • Cloud Tracing提供了不同群体(数据库服务调用,例如等待时间)的延时统计数据以及分析报告。
  • Cloud Monitoring是一款与Stackdriver(谷歌5月份收购的一个云监控初创公司)集成的智能监控系统。该系统监控云基础设施资源,如磁盘和虚拟机,还有一些为谷歌提供服务的服务等级以及十几个非谷歌提供的开源软件包。

编译/晓晓 审校/魏伟

摘自:CSDN

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2014-06-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据文摘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库专家服务
数据库专家服务(Database Expert Service,DBexpert)为您提供专业化的数据库服务。仅需提交您的具体问题和需求,即可获得腾讯云数据库专家的专业支持,助您解决各类专业化问题。腾讯云数据库专家服务团队均有10年以上的 DBA 经验,拥有亿级用户产品的数据库管理经验,以及丰富的服务经验。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档