首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

greenplum数据库实战操作

1. 场景描述

greenplum集群部署好后,软件老王在实际使用过程中碰到一些问题,简单记录下,希望能帮到有需要的朋友。

2 .解决方案2.1  gpcc监控地址

说明:非常重要,greenplum集群监控,可以监控数据库集群使用情况,包括cpu、内存、硬盘,执行情况等。

2.2 典型创建表

(1)WITH (appendonly=true, compresslevel=5)表明是只在后面新增数据,压缩比是5级(1-10);

(2)DISTRIBUTED BY (laowang),分布键,按照这个字段分布到各个segement服务器;

(3)PARTITION ,按时间分区。

2.3  创建测试表,测试分页数据是否重复

说明:创建测试表,测试分页数据是否重复

2.4 创建外部表

创建外部表,速度超级快,10万数据,几秒就完成了。

2.5 删除外部表

说明:spark导入数据后,会生成很多外部表垃圾数据,也可以批量删除下。

2.6 正常建表

说明:不分区,5级压缩,分布键为laowang1。

2.7 greenplum创建资源队列

说明:集群共享的时候,对greenplum集群资源进行分配。

2.8 有关是否走索引

大批量插入数据后,有时候会不走索引,需要操作下。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20200904A0O7X400?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券