前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Apache Kudu 1.4.0 中文文档

Apache Kudu 1.4.0 中文文档

作者头像
片刻
发布2018-01-05 16:37:57
1.9K0
发布2018-01-05 16:37:57
举报
文章被收录于专栏:AILearning

ApacheCN cwiki 地址为 : http://cwiki.apachecn.org/pages/viewpage.action?pageId=10813594

已完成 80%,欢迎加入我们一起来完成翻译!~

还差一点点就完工了,欢迎有想法的朋友,一起来维护迭代更新,另找找一位 kudu 的 admin,专门跟进这个事情,需要花的时间,稍微多一点点,有兴趣的联系我!!!

Apache Kudu 1.4.0 中文文档

Kudu 是一个针对 Apache Hadoop 平台而开发的列式存储管理器。Kudu 共享 Hadoop 生态系统应用的常见技术特性: 它在 commodity hardware(商品硬件)上运行,horizontally scalable(水平可扩展),并支持 highly available(高可用)性操作。

Kudu 有许多不错的设计,它的一些优点包括 :

  • OLAP 工作的快速处理。
  • 与 MapReduce,Spark 和其他 Hadoop 生态系统组件集成。
  • 与 Apache Impala(incubating)紧密集成,使其与 Apache Parquet 一起使用 HDFS 成为一个很好的可变的替代方案。
  • 强大而灵活的一致性模型,允许您根据每个 per-request(请求选择)一致性要求,包括 strict-serializable(严格可序列化)一致性的选项。
  • 针对同时运行顺序和随机工作负载的情况性能很好。
  • 易于管理以及可以使用 Cloudera Manager 来进行管理。
  • High availability(高可用性)。Tablet Servers 和 Masters 使用了 Raft Consensus Algorithm,确保只要有一半以上的副本可用,该 tablet 便可用于读写。例如,如果 3 个副本中有 2 个或 5 个副本中的 3 个可用,则该 tablet 可用。即使在 leader tablet 出现故障的情况下,读取功能也可以通过 read-only(只读的)follower tablets 来进行服务。
  • 结构化数据模型。

通过结合这些所有的特性,Kudu 目标是支持在当代 Hadoop 存储技术上难以实现的应用的家族。Kudu 是一个很好的解决方案的几个例子是 :

  • 报告那些需要立即向终端用户提供  newly-arrived(新来的)数据的应用程序。
  • 必须同时支持的 Time-series(时间序列)应用程序 :
    • 查询大量历史数据。
    • 必须非常快地返回关于单个实体的细粒度查询。
  • 使用预测模型进行实时决策的应用程序,可根据所有历史数据定期刷新预测模型。
  • 有关这些和其他方案的更多信息,请参阅 Example Use Cases

。。。。。。

更多细节介绍请看 : http://cwiki.apachecn.org/pages/viewpage.action?pageId=10813605

欢迎转载,请注明来源:ApacheCN » Apache Kudu 1.4.0 中文文档 | ApacheCN

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2017-07-13 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
命令行工具
腾讯云命令行工具 TCCLI 是管理腾讯云资源的统一工具。使用腾讯云命令行工具,您可以快速调用腾讯云 API 来管理您的腾讯云资源。此外,您还可以基于腾讯云的命令行工具来做自动化和脚本处理,以更多样的方式进行组合和重用。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档