首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Greenplum vs Citus for Data Warehouse

Greenplum vs Citus for Data Warehouse
EN

Stack Overflow用户
提问于 2021-02-11 07:35:39
回答 1查看 563关注 0票数 1

我正在尝试从将它们用作数据仓库的角度来评估Citus和Greenplum。一般的想法是,来自多个OLTP系统的数据将通过Kafka Connect实时集成在一个中央仓库中,以进行分析查询。

在这方面,Citus与Greenplum相比如何?我读到Citus有一些SQL限制,例如,如果关联不在分布列上,则不支持相关子查询,Greenplum是否有类似的SQL限制?如果将数据流式传输到Greenplum中(而不是批量更新),Greenplum是否可以正常工作?我只是觉得Greenplum更专注于分析,可以牺牲一些OLTP特定的东西,这是Citus负担不起的,因为他们将自己定位为HTAP (而不是OLAP)。Citus还将自己定位为亚秒级查询时间的解决方案,这对于我的用例来说并不是必需的-每个查询几秒钟(最多5秒)就足够了。

EN

回答 1

Stack Overflow用户

发布于 2021-02-11 18:16:42

我不知道Greenplum有任何SQL限制,就像您上面提到的那样。在某些情况下,即CUBEpercentile_*窗口函数(有序集合聚合函数) GPORCA,Greenplum数据库查询优化器将后退到PostgreSQL查询优化器,这些查询的性能将不如启用GPORCA的查询-但您仍然可以获得对查询的响应。

我想说获取流式数据与批量更新是一回事-使用Kafka与JDBC的连接,可以开箱即用,但不会利用Greenplum的并行分布式特性,因为所有数据都必须通过协调器。

最佳方案是使用类似Greenplum Streaming Server (GPSS)的功能,该功能可将从客户端传送的数据直接写入Greenplum Database群集的数据段,从而实现最大的并行度和最佳的流加载性能。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/66146742

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档