前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >[Hadoop权威指南](第二版)中文

[Hadoop权威指南](第二版)中文

作者头像
用户3157710
发布2018-10-10 15:29:02
6580
发布2018-10-10 15:29:02
举报

本书是您纵情享用数据之美的得力助手。作为处理海量数据集的理想工具,Apache Hadoop架构是MapReduce算法的一种开源应用,是Google(谷歌)开创其帝国的重要基石。本书内容丰富,展示了如何使用Hadoop构建可靠、可伸缩的分布式系统,程序员可从中探索如何分析海量数据集,管理员可以了解如何建立与运行Hadoop集群。.

本书完全通过案例学习来展示如何用Hadoop解决特殊问题,它将帮助您:

使用Hadoop分布式文件系统(HDFS)来存储海量数据集,通过MapReduce对这些数据集运行分布式计算..

熟悉Hadoop的数据和I/O构件,用于压缩、数据集成、序列化和持久处理

洞悉编写MapReduce实际应用程序时常见陷阱和高级特性

设计、构建和管理专用的Hadoop集群或在云上运行Hadoop

使用Pig这种高级的查询语言来处理大规模数据

利用HBase这个Hadoop数据库来处理结构化和半结构化数据

学习Zookeeper,这是一个用于构建分布式系统的协作原语工具箱

如果您拥有海量数据,无论是GB级还是PB级,Hadoop都是完美的选择。本书是这方面最全面的参考。

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2018.04.24 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档