快速入门

最近更新时间:2019-08-22 17:08:12

使用 Snova 数据仓库,您需要完成以下操作:

一. 创建集群

Snova 数据仓库目前处于内测阶段,如需使用,请先填写 申请
在创建集群之前,需要明确数据量,数据所在地域,以及访问集群的网络环境。
目前只支持 VPC 网络,因此在创建集群之前需要创建好访问集群的 VPC 网络及其子网。

二. 连接数据库

创建完集群之后,在之前配置好的子网下申请一台 CVM 用于访问集群。然后在 CVM 上通过 psql 连接数据库,如果没有安装客户端,可通过以下命令安装 PostgreSQL 的客户端程序。

yum install -y postgresql.x86_64

Snova 完全兼容 PostgreSQL 8.3.23 协议。使用 psql 连接数据库的基本语法如下:

psql  -h 10.0.0.3 -p 5436 -d postgres -U testuser

其中 postgres 是 Snova 默认的数据库,testuser 是创建数据库的时候需要用户输入的管理员帐号,5436是数据库默认的端口号,10.0.0.3 是创建完数据库后返回的 vip,该 vip 可以在控制台查询。

三. 导入数据

  1. 使用 INSERT 导入数据。
    您可以通过 INSERT 语句直接向 Snova 写入数据,适用于数据量较小的场景。

    • 使用客户端工具 psql 连接 Snova,并使用标准 INSERT 语法写入数据。
    • 通过 PostgreSQL JDBC 驱动书写应用程序向 Snova 写入数据。
  2. 使用 \COPY 命令导入数据。
    您可以使用 \COPY 命令将客户端所在主机上的文件导入到 Snova 中,语法可以参见 PostgreSQL 相关 \COPY 语法。

  3. 从 COS 外表中导入数据。
    COS 外表语法详见 COS 数据,在创建一个可读的 COS 外表后,可以使用如下语法将 COS 外表的数据导入到一张结构相同的内表中。

    INSERT INTO cos_local_tbl SELECT * FROM cos_tbl
  4. 从公有云其它环境导入数据详见 使用外表

四. 分析数据

在 Snova 中,语法完全兼容 Greenplum Database 5.x 语法,您可以参考其语法进行数据分析。

前提条件

  1. 使用管理员用户或者由其创建的其他用户连接到数据库。
  2. 创建了相应的数据库以及数据库表,例如 testdb 与 testtable。
  3. 向数据库表中插入了数据,具体插入数据方法参见 插入数据

简单的 SELECT 语句

SELECT col1,col2,col3 FROM testtable WHERE col1 = val1 AND col2 = val2;

使用上述语句可以获取数据库表 testtable 中 col1 的值为 val1 并且 col2 的值为 val2 的记录。更多分析语句可参见 Greenplum Database 5.x 官方文档