温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。
Hadoop做数仓,不是啥子新鲜概念,各家Hadoop厂商都有自己的方案。Hortonworks这两天突然官方宣布与Jethro一起来玩EDW,Fayson也没搞太懂。从Jethro的文档看上去应该很早就支持CDH5.9/5.10和HDP2.3/2.4了。参考:
http://docs.jethro.io/docs/latest/jethro-manager/supported-platforms
Hadoop做数仓一个关键东西就是SQL工具,说起这个,HDP其实挺逗的,我们看看HDP之上SQL工具的历史:
2013年2月推出Hive on Tez:
https://hortonworks.com/blog/100x-faster-hive/
2014年9月继续Tez:
https://hortonworks.com/blog/stinger-next-enterprise-sql-hadoop-scale-apache-hive/
2016年4月是Hawq:
2016年6月是Hive LLAP:
https://hortonworks.com/blog/llap-enables-sub-second-sql-hadoop/
2016年6月还有一个AtScale:
2017年5月是德鲁伊Druid:
https://hortonworks.com/blog/sub-second-analytics-hive-druid/
2017年6月还有IBM的Big SQL:
https://hortonworks.com/press-releases/ibm-hortonworks-expand-partnership/
然后现在是Jethro
……
反正我已经晕了,到底该用哪个呢。这SQL on HDP,风雨飘摇,摇摆不定,定力不够,够不着就有点蛋疼了。
好了,开个玩笑,以下内容是原文翻译,翻译的不好,将就着看吧。内容其实挺简单的,建议阅读时间为30s。
1.简介
企业数据仓库(EDW)存储着企业大量重要的数据,是关键业务分析的基础。随着企业内部业务数据的持续增长,以及最近几年大数据技术的蓬勃发展,大家突然发现传统的EDW无论是从规模,多样性以及使用方式上都无法满足自己了。
于是Hortonworks今天很高兴宣布与Jethro达成战略合作伙伴关系,从而扩充优化EDW的解决方案,帮助客户解决企业大数据仓库的规模和性能问题。
2.传统EDW的问题
传统的EDW系统一般使用专门的数据库运行在特有的硬件环境之上,以分析从有限的数据源比如ERP或者CRM导过来的结构化数据。经过一些调优后,可以加速BI工具比如Tableau,Qlik或MicroStrategy的访问。当交互式BI应用场景成为常态的应用场景时,传统的EDW一般会存在以下问题:
无论数据量多大,数据源怎么多样,数据如何复杂 – 业务用户都只有一个简单的目标,就是可以得到交互式的响应,从而更高效的完成工作。
3. Hortonworks的EDW解决方案
Hortonworks的EDW解决方案结合了HDP,Synsort和Jethro Data,包含附带的服务,以此来解决大数据EDW带来的挑战和问题。
Hortonworks Data Platform (HDP) - 集成数据治理,数据采集,数据管理,数据访问,安全和使用操作的开源Hadoop平台
Syncsort – 高效的ETL工具方便将企业内部的数据抽取到HDP
Jethro Data – 基于Hadoop数据的高效的交互式BI分析引擎
Professional Services – 专家级的指导和支持,通过最大限度的完整测试和验证,从而快速证明基于Hortonworks优化的解决方案的新架构的价值。
Hortonworks的EDW解决方案提供了一个完整的集成解决方案,来解决大数据EDW带来的挑战和问题。首先是一流的ETL工具,用于访问各种各样的数据源,可扩展的Hadoop数据湖,以及高性能的交互式BI引擎,构成了一个全面且性价比高的解决方案。
4.为什么选择Jethro Data
Jethro Data全面支持索引,动态的cubes以及查询缓存,从而在超大数据集的基础之上为交互式BI查询提供秒级响应。Jethro不需要您对应用程序进行修改,也不会更改底层数据。Jethro基于Hadoop为您提供EDW服务,成本也较低。
5.参考原文
好好过节,还最后一天了,时日无多,大家抓紧浪吧。回头有时间给大家再讲解和分析Jethro。
醉酒鞭名马,少年多浮夸! 岭南浣溪沙,呕吐酒肆下!挚友不肯放,数据玩的花! 温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。
推荐关注Hadoop实操,第一时间,分享更多Hadoop干货,欢迎转发和分享。
原创文章,欢迎转载,转载请注明:转载自微信公众号Hadoop实操