首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

常用SQL语句和语法汇总

VALUES (1, 2,...); 保留数据表,仅删除全部数据行DELETE语句 DELETE FROM ; 删除部分数据行搜索型DELETE语句 DELETE FROM ...,因此通过汇总得到视图无法进行更新 子查询作为内层查询会首先执行 标量字查询就是返回单一子查询 在细分组内进行比较时,需要使用关联子查询 ABS函数(求绝对) ABS(数值) MOD函数(求余...ELSE END SQL常用规则6 谓词就是返回为真值函数 通常指定关联子查询作为EXIST参数 作为EXIST参数子查询中经常会使用SELECT * CASE表达式中END不能省略...SQL常用规则7 集合运算会除去重复记录,但可以使用ALL选项,保留重复行 进行联结时需要在FROM子句中使用多张表 进行内联结时必须使用ON子句,并且要书写在FROM 和WHERE之间 使用联结时...原则上,窗口函数只能在SELECT子句中使用 超级分组记录默认使用NULL作为聚合键 ROLLUP可以同时得出合计和小计 使用GROUPING函数能够简单分辨出原始数据中NULL和超级分组记录中NULL

3.1K80

利用Python统计连续登录N天或以上用户

np 第一步,导入数据 原始数据是一份csv文件,我们用pandas方法read_csv直接读取 df = pd.read_csv(r"C:\Users\Gdc\Documents\登录日志.csv...这里登录日志只有两个字段:@timestamp和rold_id。前者是用户登录时间,后者是用户ID,考虑到时间格式,我们需要做简单处理去掉后面的时间保留日期。...删除日志里重复数据(同一天玩家可以登录多次,故而只需要保留一条即可) 我们看到上面处理过数据,可以发现role_id为570837202用户在1月8日存在多条记录,为方便后续计算,这里需要进行去重处理...采取drop_duplicate方案即可保留删除重复数据只保留一条 df.drop_duplicates(inplace=True) #因为玩家在某一天存在登录多次情况,这里可以用去重过滤掉多余数据...第四步,计算差值 这一步是辅助操作,使用第三步中辅助列与用户登录日期做差值得到一个日期,若某用户某几列该相同,则代表这几天属于连续登录 因为辅助列是float型,我们在做时间差时候需要用到to_timedelta

3.2K30
您找到你想要的搜索结果了吗?
是的
没有找到

常用SQL语句和语法汇总

;)结尾 SQL不区分关键字大小写,但是约定俗成写法是:关键字大写、表名首字母大写、其余(列名等)小写 字符串和日期常数需要使用单引号(’)括起来 数字常数无需加注单引号 SQL语句单词之间需要使用半角空格或换行符来进行分割...定义视图时不要使用ORDER BY子句 视图和表需要同时进行更新,因此通过汇总得到视图无法进行更新 子查询作为内层查询会首先执行 标量字查询就是返回单一子查询 在细分组内进行比较时,需要使用关联子查询...函数(截取日期元素) CAST函数(类型转换) COALESCE函数(将NULL转换为其他) CASE 表达式 SQL常用规则6 谓词就是返回为真值函数 通常指定关联子查询作为EXIST参数 作为...EXIST参数子查询中经常会使用SELECT * CASE表达式中END不能省略 SQL常用规则7 集合运算会除去重复记录,但可以使用ALL选项,保留重复行 进行联结时需要在FROM子句中使用多张表...NULL作为聚合键 ROLLUP可以同时得出合计和小计 使用GROUPING函数能够简单分辨出原始数据中NULL和超级分组记录中NULL 可以把CUBE理解为将使用聚合键进行切割模块堆积成一个立方体

2.5K50

史上最全!用Pandas读取CSV,看这篇就够了

05 列名 names用来指定列名称,它是一个类似列表序列,与数据一一对应。如果文件不包含列名,那么应该设置header=None,列名列表中不允许有重复。...# 格式为字符型str # 表头为c_0、c_2 pd.read_csv(data, prefix='c_', header=None) 10 处理重复列名 如果该参数为True,当列名重复时,解析列名将变为...NaN pd.read_csv(data, na_values={'c':3, 1:[2,5]}) 18 保留默认空 分析数据时是否包含默认NaN,是否自动识别。...,设置keep_date_col为True时,会保留这些原有的时间组成列;如果设置为False,则不保留这些列。...解析重复日期字符串,尤其是带有时区偏移日期字符串时,可能会大大提高速度。

67.1K811

Python数据分析数据导入和导出

这通常涉及到数据清洗和预处理工作,比如去除重复数据、处理缺失、转换数据类型等,以确保数据完整性和一致性。 导入数据后,接下来就需要进行数据探索和分析。...mangle_dupe_cols(可选,默认为True):用于处理重复列名。 dtype(可选,默认为None):用于指定每列数据类型。...na_values(可选,默认为None):用于指定哪些表示缺失。 keep_default_na(可选,默认为True):用于指定是否保留默认缺失标识符。...keep_date_col(可选,默认为False):用于指定是否保留原始日期列。 date_parser(可选,默认为None):用于指定自定义日期时间解析函数。...可以设置为’\r\n’、‘\n’、'\r’等 chunksize:一次性写入行数,默认为None,表示全部写入 date_format:日期格式,默认为None。

12910

Oracle数据库之第一篇

ORACLE 数据库是目前世界上使用最为广 泛数据库管理系统,作为一个通用数据库系统,它具有完整数据管理功能;作为一个 关系数据库,它是一个完备关系产品;作为分布式数据库它实现了分布式处理功能...它不要求用户指定对数据存放方法,也不需要用户了解 具体数据存放方式,所以具有完全不同底层结构不同数据库系统, 可以使用相同结构 化查询语言作为数据输入与管理接口。...3.消除重复数据 Select distinct *|列名, ... from emp; 使用distinct 可以消除重复行,如果查询多列必须保证多列都重复才能去掉重复 4....max() 求最大 */ /* 数值函数 对数值做处理函数 四舍五入 round(v1,v2) v1是原始数值,v2是保留小数位数...截取 trunc(v1,v2) v1是原始数值,v2是保留小数位数 不做四舍五入 取余数 mod(v1,v2) 10%3 答案 --1 */

3.3K10

pandas系列 - (三)关于时点时期数据处理

1、数据源读取; 2、数据指标归并,将A1、A2指标,归并为A,归并参照表以EXCEL形式储存; 3、数据汇总,用于原始数据是单个地方数据,比如通过汇总关系,汇总出华北地区,华南地区数据;...5、增加相对数据,一般时点数据都是当期,用于分析化,还需要知道“比上期”、“比年初”、“同比”等值、  主函数: %%time # 获取源数据 df = get_src_data(r'data/input...# 计算字段,通过现有指标,计算出新指标 def calcu_data(df): # 补充没有的列名,形成差集,补充新列,这里是为了避免最后计算时造成误差 dft = dfcz[(...,如果是空的话,择不保留。...当期')) # 根据指标名称,包含%只需要增加同比增减,不包含化计算增速 dftest.loc[dsel,'31 同比增减'] = dftest[dsel].apply(add_tongbi

95020

数据分析利器--Pandas

与其它你以前使用过(如R data.frame)类似Datarame结构相比,在DataFrame里面向行和面向列操作大致是对称。...文件路径 sep或者delimiter 字段分隔符 header 列名行数,默认是0(第一行) index_col 列号或名称用作结果中行索引 names 结果列名称列表 skiprows 从起始位置跳过行数...默认为False keep_date_col 如果将列连接到解析日期保留连接列。默认为False。 converters 列转换器 dayfirst 当解析可以造成歧义日期时,以内部形式存储。...skip_footer 文件末尾需要忽略行数 verbose 输出各种解析输出信息 encoding 文件编码 squeeze 如果解析数据只包含一列,则返回一个Series thousands...DataFrame.drop_duplicates() 它用于返回一个移除了重复DataFrame DataFrame.fillna() 将无效替换成为有效 5、Pandas常用知识点 5.1

3.6K30

SQL总结

...); 插入数据 INSERT INTO (列名1,列名2,...) VALUES (1,2,...);(每列都有数据插入时,可省略列名。...;(常搭配函数有:SUM()、AVG()、COUNT()、MAX()、MIN()) 查询不重复结果 SELECT DISTINCT ,, FROM WHERE 条件...常用函数 函数名 用途 ABS(数值) ABS函数(求绝对) MOD(被除数,除数) MOD函数(求余) ROUND(对象数值,保留小数位数) ROUND函数(四舍五入) 字符串1丨丨字符串2...可以在更新数据时更新此栏位 EXTRACT(日期元素 FROM 日期) EXTRACT函数(截取日期元素) CAST(转换前 AS 想要转换数据类型) CAST函数(类型转换) COALESCE(...FROM ; 总结   如需要找到符合条件一些表可以去查询information_schema中信息,例如:SELECT * FROM information_schema.TABLES

15810

mysql基本命令

表名; -- 查询所有列: select * from 表名; -- 去重:(关键字:distinct)[去掉该列中重复项] select distinct 列名 from 表名; -- 查询并临时修改列名...) 包含 id not in (1,2,3,4,5,6) 不包含 and 与/和 or 或 not 非 -- 3.查询指定列在指定区间内:(所有该列10~20之间项) -- 写法1:select...表名 order by 列名 desc; -- 结合排序查询与条件查询 -- 先过滤条件,再进行排序: -- 查询列1中所有包含'张三'字段信息,并根局列2中大小进行降序排序; select...是在分组后对数据进行过滤 -- where 是在分组前对数据进行过滤 -- 在之前例子中:我们要对已经得到数据再进行一个筛选: -- 比如说在得到数据中,我们只需要列1大于18所有,这是在代码后再加一个...-- 获取日期是本年第几天, 在1到366之间 SELECT DAYOFYEAR('1998-02-03'); -- 获取日期是本月第几天, 在1到31之间 SELECT DAYOFMONTH

1.5K20

Spring认证中国教育管理中心-Spring Data Couchbase教程二

由于持久性操作通常需要一个构造函数来获取所有参数,因此它们声明变成了对字段分配样板参数繁琐重复,使用 Lombok 可以最好地避免这种情况@AllArgsConstructor。...对不同使用相同字段/列名称通常会导致数据损坏,因此您应该使用明确字段/列名称注释至少一个属性。...它允许创建新实例,因为 Kotlin 生成一个copy(…)创建新对象实例方法,该方法从现有对象复制所有属性并将作为参数提供属性应用到该方法。...对不同使用相同字段/列名称通常会导致数据损坏,因此您应该使用明确字段/列名称注释至少一个属性。 @AccessType(PROPERTY)由于无法设置超属性,因此无法使用 using 。...如果它们只包含最后一段中原始字段类型,则您也不需要添加特殊处理。这是一个例子: 示例 7.

1.8K50

Pandas 2.2 中文官方教程和指南(十·二)

标签也可以通过函数value_labels检索,但在使用之前需要调用read()。 参数convert_missing指示是否应保留 Stata 中缺失表示。...如果需要原始,可以通过设置convert_categoricals=False来导入原始数据(但不包括变量标签)。...原始可以与导入分类数据匹配,因为原始Stata数据与导入Categorical变量类别代码之间存在简单映射:缺失被分配代码-1,最小原始被分配0,第二小被分配1,依此类推,直到最大原始被分配代码...names 数组样式,默认为`None` 要使用列名列表。如果文件不包含表头行,则应明确传递`header=None`。不允许在此列表中存在重复项。...cache_dates 布尔,默认为 True 如果为True,则使用一个唯一转换日期缓存来应用日期时间转换。在解析重复日期字符串时可能会产生显著加速,特别是带有时区偏移日期字符串。

12200

数据库相关

* from tab;查询所有的表 查看数据表结构DESC:desc emp; 执行host命令:host+命令 host dir; 关于原始用户问题: 恢复原始数据: 1、登陆sys用户:...,如果希望对指定列进行排序,就需要使用order by 排序 语法: SELECT[DISTINCT] *|列名 [as] 列别名,列名 [as] 列别名.......:count(*)、count(字段)、count(dinstinct)有什么区别 1、全部统计 2、不统计null 3、不统计重复 尽量不使用*,所有函数在没有数据时候都是返回null;但是count...在没有数据时候返回0,所以在java中是不需要对结果进行判断 SUM()求和 AVG()平均值 MAX()最大 MIN()最小 median()中间 STDDEV()标准差 范例统计处公司最早雇佣和最晚雇佣...) zuiwan from emp; 单字段分组查询 掌握group by使用 需求一:公司中要求每个部门一组进行拔河比赛 需要部门列内容需要重复 select * from emp job和deptno

1.8K50

Python库实用技巧专栏

, 不同Key保留 result2 = test1 - test2 # counter相减: 相同Key相减, 不同Key用0代替再相减, 结果只保留value是正值key result3 = test1...=0表示第一行数据而不是文件第一行 names: array like 用于结果列名列表, 若数据文件中没有列标题行则需要执行header=None, 默认列表中不能出现重复, 除非设定参数mangle_dupe_cols...=False来使pandas不适用第一列作为行索引 usecols: array-like 返回一个数据子集, 该列表中必须可以对应到文件中位置(数字可以对应到指定列)或者是字符传为文件中列名...从文件头开始算起) na_values: scalar, str, list-like, or dict 一组用于替换NA/NaN, 如果传递, 需要制定特定列。...names or list of lists or dict 传递True将会解析索引 传递list of ints or names(例如[1, 2, 3])将会解析1,2,3列作为独立日期

2.3K30

Pandas三百题

df['语言']=df.groupby('国家/地区').语言.bfill() 重复处理 18-查找重复 df[df.duplicated()] 19-查找重复|指定 查找 片名 列全部重复...df[df['片名'].duplicated()] 20-删除重复 删除全部重复 df.drop_duplicates() 21-删除重复|指定 删除全部重复,但保留最后一次出现 df.drop_duplicates...'].isin(['中国','美国','英国','日本','巴西']))&(df['金牌数']<30) 36 -筛选行|条件(包含指定) 提取 国家奥委会 列中,所有包含行 df[df['国家奥委会...组合(行号+列号) 提取第 4 行,第 4 列 df.iloc[3,3] 40 - 筛选|组合(行号+列名) 提取行索引为 4 ,列名为 金牌数 df.at[4,'金牌数'] 41 - 筛选...| 将 df1 索引设置为日期,将 df1 数据向后移动一天 df1.set_index(['日期']).shift(1) 25 - 日期重采样|日 -> 周 按周对 df1 进行重采样,保留每周最后一个数据

4.6K22

sql server时间戳timestamp

每次插入或更新包含 timestamp 列行时,timestamp 列中均会更新。这一属性使 timestamp 列不适合作为键使用,尤其是不能作为主键使用。...第一个 4 字节存储 base date(即 1900 年 1 月 1 日)之前或之后天数。基础日期是系统参考日期。不允许早于 1753 年 1 月 1 日 datetime 。...timestamp 通常用作给表行加版本戳机制。 存储大小为 8 个字节。 timestamp 数据类型只是递增数字,不保留日期或时间。 若要记录日期或时间,请使用 datetime 数据类型。...每次修改或插入包含 timestamp 列行时,就会在 timestamp 列中插入增量数据库时间戳。 这一属性使 timestamp 列不适合作为键使用,尤其是不能作为主键使用。...在使用 rowversion 时,必须指定列名。 注意: 在使用其中 SELECT 列表中具有 timestamp 列 SELECT INTO 语句时,可能会生成重复时间戳

8410

Read_CSV参数详解

names : array-like, default None 用于结果列名列表,如果数据文件中没有列标题行,就需要执行header=None。...usecols : array-like, default None 返回一个数据子集,该列表中必须可以对应到文件中位置(数字可以对应到指定列)或者是字符传为文件中列名。...squeeze : boolean, default False 如果文件包含一列,则返回一个Series prefix : str, default None 在没有列标题时,给列添加前缀。...na_values : scalar, str, list-like, or dict, default None 一组用于替换NA/NaN。如果传参,需要制定特定列。默认为‘1....If [1, 2, 3] -> 解析1,2,3列作为独立日期列; list of lists. e.g. If [[1, 3]] -> 合并1,3列作为一个日期列使用 dict, e.g.

2.7K60

python pandas.read_csv参数整理,读取txt,csv文件

names : array-like, default None 用于结果列名列表,如果数据文件中没有列标题行,就需要执行header=None。...usecols : array-like, default None 返回一个数据子集,该列表中必须可以对应到文件中位置(数字可以对应到指定列)或者是字符传为文件中列名。...squeeze : boolean, default False 如果文件包含一列,则返回一个Series prefix : str, default None 在没有列标题时,给列添加前缀。...na_values : scalar, str, list-like, or dict, default None 一组用于替换NA/NaN。如果传参,需要制定特定列。默认为‘1....If [1, 2, 3] -> 解析1,2,3列作为独立日期列; list of lists. e.g. If [[1, 3]] -> 合并1,3列作为一个日期列使用 dict, e.g.

6.3K60
领券