首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

想学数据分析但不会Python,过来看看SQL吧(下)~

SQL聚合 有时候我们只是需要获取数据的汇总信息,比如说行数啊、平均值啊这种,并不需要吧所有数据都检索出来,为此,SQL提供了专门的函数,这也是SQL最强大功能之一。...时间序列的处理 在SQL中有一套专门的内置函数,用来处理时间序列,那就是DATE函数SQL Date 数据类型 先了解一下在不同的数据库中的时间序列的表示。...`DATE_PART`函数 DATE_PART 可以用来获取日期的特定部分,如获取日期2018-10-6的月份,只会获得一个结果10,这是它与DATE_TRUNC的最大区别。...TO_DATE函数可以将某列转为DATE格式,主要是将单独的月份或者年份等等转换为SQL可以读懂的DATE类型数据,这样做的目的是为了后续可以方便地使用时间筛选函数。...CAST函数 CAST函数SQL中进行数据类型转换的函数,但经常用于将字符串类型转换为时间类型。

3.1K30

greenplum gpcrondump命令使用

gpcrondump工具在Master和每个Segment上储一个Greenplum数据库的内容为SQL脚本文件。 这些脚本文件接下来可以被用来恢复这个数据库。...Master的备份文件包含用于创建数据库模式的SQL命令。 Segment的数据储文件包含将数据装载到表中的SQL语句。Segment的储文件被使用gzip压缩。...-g(复制配置文件) 保护主要和段配置文件postgresql.conf,pg_ident.conf和pg_hba.conf的副本。...这些配置文件被储到 master或segment数据目录到db_dumps / YYYYMMDD / config_files_ .ta -G(储全局对象) 使用pg_dumpall...20190517181512_table 6 、总结gpcrondump命令 1、在以上可以看出备份7455 MB 的数据耗时(18:15:12到18:15:53)41s,大概181M/s ,包括所有的函数

1.9K20
您找到你想要的搜索结果了吗?
是的
没有找到

greenplum gpcrondump命令使用

gpcrondump工具在Master和每个Segment上储一个Greenplum数据库的内容为SQL脚本文件。 这些脚本文件接下来可以被用来恢复这个数据库。...Master的备份文件包含用于创建数据库模式的SQL命令。 Segment的数据储文件包含将数据装载到表中的SQL语句。Segment的储文件被使用gzip压缩。...-g(复制配置文件) 保护主要和段配置文件postgresql.conf,pg_ident.conf和pg_hba.conf的副本。...这些配置文件被储到 master或segment数据目录到db_dumps / YYYYMMDD / config_files_ .tar -G(储全局对象) 使用pg_dumpall...20190517181512_table 6 、总结gpcrondump命令 1、在以上可以看出备份7455 MB 的数据耗时(18:15:12到18:15:53)41s,大概181M/s ,包括所有的函数

1.9K30

国产达梦数据库与MySQL的区别

背景 由于项目上的需要,把项目实现国产化,把底层的MySQL数据库替换为国产的达梦数据库,花了一周的时间研究了国产的数据库-达梦数据库,它和MySQL有一定的区别,SQL的写法也有一些区别。...2、高性能 支持列存储、数据压缩、物化视图等面向联机事务分析场景的优化选项; 通过表级行存储、列存储选项技术,在同一产品中提供对联机事务处理和联机分析处理业务场景的支持; 3、高可用 可配置数据守护系统...代替 功能和 datepart 一样,写法不同,参数顺序颠倒,且都要加引号, 例子: select date_part('2018-12-13 08:45:00', 'year');--2018...select date_part('2018-12-13 08:45:00', 'mm'); -- 12 c: 使用 extract 代替, 语法:extract(dtfield from date...总结 达梦数据库和 oracle 数据库比较像,如果找不到和 MySQL 对应的函数,可以看下 oracle 的相关函数。 它的使用文档可以在官网下载到。

14.8K41

Greenplum数据库使用总结--目录部分

函数的使用- 65 - 6.6.6 把查询数据转化为JSON- 66 - 6.6.6.1 查看原始数据- 66 - 6.6.6.2 把查询的数据转化为JSON- 67 - 7 Greenplum PGBENCH...参数详解- 69 - 7.2.1 查看参数详细信息- 69 - 7.3 PGBENCH 测试案例- 70 - 7.3.1 创建表信息- 70 - 7.3.2 修改以下参数- 70 - 7.3.2.1修改配置文件...- 70 - 7.3.2.2重启服务- 71 - 7.3.3创建SQL测试文件- 71 - 7.3.4查看测试效果- 71 - 8 Greenplum 常用函数- 73 - 8.1 字符串函数- 73...- 74 - 8.1.2.4 在制定的位置截取字符串- 74 - 8.1.2.5 删除字符串的制定字符- 75 - 8.1.2.6 字符串大小写- 75 - 8.1.2.7 替换制定的字符串- 75...90 - 10.1在使用外表时注意的问题- 90 - 10.1.1 注意\线的转义问题- 90 - 10.1.1.1 问题示例- 90 - 10.1.1.2 解答方法- 91 - 10.1.2 \1特殊字符的问题

1.3K10

Greenplum 实时数据仓库实践(3)——Greenplum与数据仓库

统计配置 3.4 为什么选择Greenplum 3.4.1 Greenplum还是SQL-on-Hadoop 3.4.2 适合DBA的解决方案 1. 给内部函数起别名 2. 返回结果集的表函数 3....,将实际的数据存储设备分成一个个段服务器上的小存储单元,每个单元都有一个连接本地磁盘的专用独立的、高带宽通道。...大多数情况下,在SQL支持、功能、配置选项和最终用户功能方面与PostgreSQL非常相似。用户操作Greenplum数据库就像与常规PostgreSQL交互一样。...依据命令是单独执行,还是在函数中执行,自动收集统计信息模式的设置方法也不一样。如果是在函数外单独执行,gp_autostats_mode配置参数控制统计模式,缺省值为on_no_stats。...数据库应用开发人员常用的自然是SQL和pgSQL,PL/pgSQL函数可以为SQL语言增加控制结构,执行复杂计算任务,并继承所有PostgreSQL的数据类型(包括用户自定义类型)、函数和操作符。

3.9K20

Greenplum迁移指南

3、易用性:Greenplum相对于Hadoop平台,SQL表达能力更为突出,应用改造成本要小很多。...4.3 元数据迁移 1、Oracle到Greenplum没有现成的工具,可以借助部分自动化转换工具先将Oracle语法转换为Postgresql语法,再通过脚本替换,最终转换为Greenplum语法。...4.4 元数据迁移 SCT会自动进行类型转换,如果你想了解更多OracleGreenpm中不同数据类型的映射关系如下表 Oracle Greenplum 说明 VARCHAR2(n) VARCHAR(...n) 在Oracle中n代表字节数,在Greenplum中n代表字符数 CHAR(n) CHAR(n) 同上 NUMBER(n,m) NUMERIC(n,m) number可以转换为numeric,但真实业务中数值类型可以用...- pg_dump -s schema.sql sourcedb - 手工接入,修改脚本对应的分布键,分区等语法,优化储存过程 - psq -f schema.sql -d targetdb 5.3 数据迁移

1.8K30

Greenplum迁移指南

3、易用性:Greenplum相对于Hadoop平台,SQL表达能力更为突出,应用改造成本要小很多。...4.3 元数据迁移 1、Oracle到Greenplum没有现成的工具,可以借助部分自动化转换工具先将Oracle语法转换为Postgresql语法,再通过脚本替换,最终转换为Greenplum语法。...4.4 元数据迁移 SCT会自动进行类型转换,如果你想了解更多OracleGreenpm中不同数据类型的映射关系如下表 Oracle Greenplum 说明 VARCHAR2(n) VARCHAR(...n) 在Oracle中n代表字节数,在Greenplum中n代表字符数 CHAR(n) CHAR(n) 同上 NUMBER(n,m) NUMERIC(n,m) number可以转换为numeric,但真实业务中数值类型可以用...- pg_dump -s schema.sql sourcedb - 手工接入,修改脚本对应的分布键,分区等语法,优化储存过程 - psq -f schema.sql -d targetdb 5.3 数据迁移

1.9K30

07-08 创建计算字段使用函数处理数据第7章 创建计算字段第8章 使用函数处理数据

但是 SQL 函数会带来一些问题: 每一个 DBMS 都有特定的函数,只有少数几个函数被所有主要的 DBMS 支持。...文本处理函数 UPPER()将文本转换为大写 SELECT vend_name, UPPER(vend_name) AS vend_name_upcase FROM Vendors ORDER BY...LOWER()(Access使用LCASE()) 将字符串转换为小写 LTRIM() 去掉字符串左边的空格 RIGHT()(或使用子字符串函数) 返回字符串右边的字符 RTRIM() 去掉字符串右边的空格...SOUNDEX() 返回字符串的SOUNDEX值 UPPER()(Access使用UCASE()) 将字符串转换为大写 表中的 SOUNDEX 需要注意,SOUNDEX 是一个将任何文本串转换为描述其语音表示的字母数字模式的算法...PostgreSQL 版本的DATE_PART()函数: SELECT order_num FROM Orders WHERE DATE_PART('year', order_date) = 2012;

3.7K20

GreenPlum备份和恢复工具之gpbackup和gprestore

pg_restore 需要由创建的压缩储文件 pg_dump/ pg_dumpall。...开始还原之前,应该修改 CREATE TABLE 储文件中的语句以包含Greenplum DISTRIBUTED 子句。...警告:对Greenplum数据库段配置的更改会使增量备份无效。更改段配置(添加或删除段实例)之后,必须先创建完整备份,然后才能创建增量备份。...4.pgdump&pgrestore 在Greenplum中,我们可以使用 gp_restore 或者 gpdbrestore 对数据库进行并行恢复,但是并行恢复要求要恢复的新集群与备份集群拥有同样的配置...储格式可以是一个脚本或者归档文件。储脚本的格式是纯文本,包含许多SQL命令,这些SQL命令可以用于重建该数据库并将之恢复到保存脚本时的状态。可以使用 psql从这样的脚本中恢复。

1K30

Orca: A Modular Query Optimizer Architecture for Big Data(翻译)

当遇到意外错误时,AMPERe会自动触发储,但也可以按需生成以调查次优查询计划。储捕获了重现问题所需的最小数据量,包括输入查询、优化器配置和元数据,以DXL格式序列化(参见第3节)。...图片AMPERe允许在生成储的系统之外重放储。任何Orca实例都可以加载储文件,以检索输入查询、元数据和配置参数,以便调用与触发问题情况完全相同的优化会话。...这个过程在图10 中描述,其中优化器从储中加载输入查询,为元数据创建基于文件的MD提供程序,设置优化器的配置,然后启动优化线程以立即重现问题。...TPC-DS查询中丰富的SQL语法(包括WITH子句、窗口函数、子查询、外连接、CASE语句、Intersect、Except等)对于任何查询引擎都是一个严格的SQL兼容性测试。...SQL On Hadoop 在Hadoop上执行SQL的经典方法是使用Hive [28]将查询转换为MapReduce作业。对于交互式分析,MapReduce的性能可能不尽人意。

32630

Snova运维篇(三):GP数据库备份和恢复

定期执行备份能确保在数据损坏或者系统失效发生时能恢复数据或者重建Greenplum数据库系统。用户还可以使用备份从一个Greenplum数据库系统迁移数据到另一个。...全量备份 gpcrondump工具 Master的备份文件包含用于创建数据库模式的SQL命令。Segment的数据储文件包含将数据装载到表中的SQL语句。...增量备份 改变Greenplum数据库的Segment配置会让增量备份无效。在更改了Segment配置后必须先创建和一个完全备份,才能接着创建增量备份。...-b YYYYYMMDD – 恢复Segment数据目录的db_dumps子目录中指定日期的储文件。...确保数据库已经有完整的备份 包括Master的储文件(gp_dump_-1_1_timestamp、gp_dump_-1_1_timestamp_post_data)以及每个Segment实例一个的储文件

1.9K10

Greenplum数据库使用总结(干货满满)--

1 Greenplum整体架构信息 1.1 架构图示 ?...业务数据的存储和存取 2.sql的解析并形成分布式的执行计划 2.执行由master分发的sql语句 3.将生成好的执行计划分发到每个Segment上执行 3.对于master来说,每个Segment都是对等的...,负责对应数据的存储和计算 4.收集Segment的执行结果 4.每一台机器上可以配置一到多个Segment 5.master不存储业务数据,只存储数据字典 5.由于每个Segment都是对等的,建议采用相同的机器配置...2 Greenplum数据库常用知识 2.1 Greenplum 概念 Greenplum的架构采用了MPP(大规模并行处理)。在 MPP 系统中,每个 SMP节点也可以运行自己的操作系统、数据库等。...与传统的SMP架构明显不同,通常情况下,MPP系统因为要在不同处理单元之间传送信息,所以它的效率要比SMP要差一点,但是这也不是绝对的,因为 MPP系统不共享资源,因此对它而言,资源比SMP要多,当需要处理的事务达到一定规模时

7.4K21

Greenplum 实时数据仓库实践(5)——实时数据同步

缺点是在某些情况下会导致主库与从库中的数据不一致,例如last_insert_id()、now()等非确定性函数,以及用户自定义函数(user-defined functions,udf)等易出现问题。...该格式不记录SQL语句的上下文信息,仅记录哪条数据被修改了,修改成了什么样子,能清楚记录每一行数据的修改细节。其优点是不会出现某些特定情况下的存储过程、函数或触发器的调用和触发无法被正确复制的问题。...中继日志、I/O线程、SQL线程是MySQL内部的实现。在本专题讨论的异构环境中,源是MySQL,目标是Greenplum。...将该SQL脚本改为Greenplum版: 去掉Engine=InnoDB,这是MySQL用的。 将tinyint改为smallint,Greenplum没有tinyint数据类型。...工作原理和操作步骤别无二致,只是实现的组件变了,maxwell替换为Canal Server,bireme替换为Canal Adapter,而这对于数据仓库用户来说完全透明。

3.5K30

GreenPlum中的数据库对象

,information_schema.sqlsql_features.txt,system_views.sqlGreenplum还有一个特定的目录cdb_init.d);setup_locale_encoding...这个方案由Greenplum数据库系统内部使用。 gp_toolkit是一个管理用途的方案,它包含用户可以用SQL命令访问的外部表、视图和函数。...用一个外部表交换一个分区的例子 这是一个简单的例子,它把这个分区表的一个叶子子分区交换为一个外部表。分区表包含2010至2013年份的数据。...这些步骤把表sales_1_prt_yr_1交换为一个使用gpfdist协议的外部表: step 1.确保Greenplum数据库系统启用了该外部表协议。这个例子使用了gpfdist协议。...注意如果启用了镜像,在UPDATE或DELETE语句中不允许使用nextval函数。在Greenplum数据库中不支持函数 currval和。

60920

GreenPlum的角色权限及客户端认证管理

Greenplum数据库中通过创建一个表示组的角色,然后然后把这个组角色的成员关系授予给个别用户角色来实现这一点。 使用SQL命令CREATE ROLE来创建一个新的组角色。...4.加密数据 Greenplum数据库包括一个可选的加密/解密函数包,名为pgcrypto。pgcrypto函数允许数据库管理员以加密的形式存储特定列的数据。...要使用pgcrypto函数,在想要使用这种能力来查询其他数据库的每个数据库中安装脚本$GPHOME/share/postgresql/contrib/pgcrypto.sql: $ psql -d testdb...-f $GPHOME/share/postgresql/contrib/pgcrypto.sql 5.基于时间的认证 Greenplum数据库允许管理员限制角色在特定时间的访问。...如果用户想要允许任 允许到Greenplum数据库的连接 编辑pg_hba.conf文件 认证方法 限制并发连接 加密客户端/服务器连接 允许到Greenplum数据库的连接 客户端访问和认证受到配置文件

50740

gpcrondump与gpdbrestore命令使用

gpcrondump工具在Master和每个Segment上储一个Greenplum数据库的内容为SQL脚本文件。 这些脚本文件接下来可以被用来恢复这个数据库。...Master的备份文件包含用于创建数据库模式的SQL命令。 Segment的数据储文件包含将数据装载到表中的SQL语句。Segment的储文件被使用gzip压缩。...-g(复制配置文件) 保护主要和段配置文件postgresql.conf,pg_ident.conf和pg_hba.conf的副本。...这些配置文件被储到 master或segment数据目录到db_dumps / YYYYMMDD / config_files_ .tar -G(储全局对象) 使用pg_dumpall...要储的Greenplum数据库的名称。 -y reportfile 指定备份作业日志文件将放置在主控主机上的完整路径名。如果未指定,则默认为主数据目录或正在运行 远程,当前的工作目录。

1.7K50
领券