1. 场景描述
greenplum集群部署好后,软件老王在实际使用过程中碰到一些问题,简单记录下,希望能帮到有需要的朋友。
2 .解决方案2.1 gpcc监控地址
说明:非常重要,greenplum集群监控,可以监控数据库集群使用情况,包括cpu、内存、硬盘,执行情况等。
2.2 典型创建表
(1)WITH (appendonly=true, compresslevel=5)表明是只在后面新增数据,压缩比是5级(1-10);
(2)DISTRIBUTED BY (laowang),分布键,按照这个字段分布到各个segement服务器;
(3)PARTITION ,按时间分区。
2.3 创建测试表,测试分页数据是否重复
说明:创建测试表,测试分页数据是否重复
2.4 创建外部表
创建外部表,速度超级快,10万数据,几秒就完成了。
2.5 删除外部表
说明:spark导入数据后,会生成很多外部表垃圾数据,也可以批量删除下。
2.6 正常建表
说明:不分区,5级压缩,分布键为laowang1。
2.7 greenplum创建资源队列
说明:集群共享的时候,对greenplum集群资源进行分配。
2.8 有关是否走索引
大批量插入数据后,有时候会不走索引,需要操作下。
领取专属 10元无门槛券
私享最新 技术干货