前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >hadoop发行商介绍:Hortonworks

hadoop发行商介绍:Hortonworks

作者头像
大数据和云计算技术
发布2018-03-08 10:24:46
1.4K0
发布2018-03-08 10:24:46
举报
文章被收录于专栏:大数据和云计算技术

‍‍ Hadoop是开源的,但是企业版本其实是由几家大的公司把持,这个就类似li‍‍nu‍‍x的redhat和suse一样,提供hadoop发型版本的公司主要的有Hortonworks,Cloudera,mapR。‍‍‍‍

‍‍ 今天简单介绍Hortonworks: ‍‍ ‍‍

‍‍ 先了解下Hortonworks的起源,Hortonworks公司,由Yahoo和Benchmark Capital‍‍于2011年7月联合创建,出身于名门Yahoo,Hortonworks拥有着许多Hadoop架 ‍‍构师和源代码贡献者,这些源代码贡献者以前均效力于Yahoo,而且已经为Apache Hadoop项目贡献了超过80%的源代码。‍‍

‍‍ Hortonworks的发版本框架如下:‍‍

‍‍简单介绍几个业界用得比较多的组件:

Apache Hive:Hive 基于 MapReduce 而构建,是一种数据仓库,通过用于存储在 HDFS 中的大型数据集的类 SQL 接口实现便利的数据汇总和临时查询。

‍‍Apache Mahout:Mahout 为 Hadoop 提供可扩展机器学习算法,帮助数据科技实现基于群集、分类和批处理的协作性筛选。‍‍

Apache HBase:一种面向列的 NoSQL 数据存储系统,为用户应用程序提供对于大数据的随机实时读/写访问权限。

Apache Storm:Storm 是一种分布式实时计算系统,用于处理快速、大型的数据流,为 Apache Hadoop® 2.x 带来可靠的实时数据处理功能

Apache Ambari:用于 Apache Hadoop 群集的一种开源安装生命周期管理、营运和监控系统。

Apache Oozie:Oozie Java Web 应用程序用于计划 Apache Hadoop 作业。Oozie 按顺序将多个作业组合至一个逻辑工作单位。‍‍

其他更详细的资料可以访问官网:http://zh.hortonworks.com/hadoop/。

‍‍关于hadoop开源软件,大家要有以下认识:

‍‍1、开源并不等于免费,这些发行版公司通过收取服务费的方式赚钱。‍‍

‍‍‍‍2、开源软件,如果是企业级应用,自身没有足够的研发能力的话,还是要尽量选用发型版本,以获得技术支持‍‍。

‍‍3、‍‍开源软件往‍‍往不能‍‍满足需求,二次集成‍‍,二次开发的能力很重要,但凡有一定技术能力的公司应该立足在用的基础上,应该发展和锻炼自己的技术团队。‍‍

‍‍4、业界还有很多公司也给hadoop贡献源码,但是并不发行企业版本。国内如阿里巴巴,华为等等,这些公司贡献源码,主要是要使自己的代码能合入开源主干,这样修改的代码可以得到开源社区的力量继续发展。如果开发的东西不能合入开源主干的话,一两年之后就落后于开源社区。‍‍

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2014-05-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据和云计算技术 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
流计算 Oceanus
流计算 Oceanus 是大数据产品生态体系的实时化分析利器,是基于 Apache Flink 构建的企业级实时大数据分析平台,具备一站开发、无缝连接、亚秒延时、低廉成本、安全稳定等特点。流计算 Oceanus 以实现企业数据价值最大化为目标,加速企业实时化数字化的建设进程。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档