Pandas的核心数据结构是Series和DataFrame。 Series是一个一维标记数组,可以容纳多种数据类型。DataFrame则是一种二维表状结构,由行和列组成,类似于电子表格或SQL表。...它提供了各种函数来过滤、排序和分组DataFrame中的数据。...False]) # 按单列对DataFrame进行分组并计算另一列的平均值 grouped_data = df.groupby('column_name')['other_column'].mean...() # 按多列对DataFrame进行分组并计算另一列的总和 grouped_data = df.groupby(['column_name1', 'column_name2'])['other_column...# 计算某列的最大值 df['column_name'].max() # 计算某列中非空值的数量 df['column_name'].count() # 计算列中某个值的出现次数 df['column_name
SQL查询语言(DQL)是SQL语言的一个子集,用于从数据库中查询(检索)数据。它允许您指定条件,并从一个或多个表中检索数据的子集。查询的结果通常以表格的形式返回,这些表格称为“结果集”。...DQL的主要任务是从数据库中选择数据,这通常涉及以下操作: 选择数据:选择需要检索的表和列。 过滤数据:定义条件,以筛选出符合条件的数据。 排序数据:按照指定的列对结果进行排序。...; 在这个查询中,我们从名为employees的表中选择first_name和last_name列,仅选择department等于’HR’的行,然后按last_name列对结果进行排序。...AVG():计算列的平均值。 MAX():找到列的最大值。 MIN():找到列的最小值。...子查询:子查询是嵌套在其他查询内部的查询,它可以用于从一个查询中检索数据,并将其用作另一个查询的条件。
②获得表中行组的和 ③找出表列(或所有行或某些特定的行)的最大值、最小值和平均值 聚集函数(aggregate function):运行在行组上,计算和返回单个值的函数(MySQL还支持一些列的标准偏差聚集函数...) as max_price from products; 这条SQL语句中国返回products表中price列的最大值; PS:MySQL允许max()用来返回任意列中的最大值,包括返回文本列的最大值...;但用于文本数据时,如果数据按相应的列排序,则max()返回最后一行(max()函数忽略列值为null的行) 4、min()函数 min()返回指定列的最小值,min()也要求指定列名,例子如下: select...min(prod_price) as min_price from products; 这条SQL语句中min()返回products表中price列最小值; PS:MySQL允许min()用来返回任意列中的最小值...,包括返回文本列的最小值;但用于文本数据时,如果数据按相应的列排序,则min()返回最前面的行(min()函数忽略列值为null的行) 5、sum()函数 sum()函数用来返回指定列值的和(总计);例子如下
所有的表都是由一个或者多个列组成的。 数据库中的每个列都应该是具有的相同数据类型datatype。数据类型定义了列可以存储哪些数据类型。...行 表中的数据是按照行来进行存储的,所保存的每个记录存储在自己的行内。如果把表想象成一个网格,那么网格中垂直的列则为表列,水平则为表行。 行表示的是一个记录。行有时候也称之为记录。...主键 表中每一行都应该都有一列或者几列来唯一标识自己。主键用来表示一个特定的行。 主键:一列或者几列,其值能够标识表中每行。...如果表中的列可以作为主键,则它必须满足: 任意两行都不具有相同的主键值(主键列不允许NULL值) 每行都必须有一个主键值 主键列中的值不允许修改或者更新 主键值不能重用(如果某行从表中删除,则它的主键不能赋给以后的行记录...如果它不是最后的子句,那么就会报错。 按多个列排序 在实际的需求中,我们经常会遇到根据多个列进行排序。比如根据员工的姓名排序,如果姓相同,再根据名字进行排序。
COUNT 函数是 SQL 中常用的聚合函数之一,用于快速计算行数。在数据统计和分析中具有广泛应用,通过不同的参数和条件组合,可以灵活地满足各种统计需求。...SUM: 计算每个分组中某列的总和。 AVG: 计算每个分组中某列的平均值。 MIN: 找出每个分组中某列的最小值。 MAX: 找出每个分组中某列的最大值。...OVER 子句是 SQL 中用于配合窗口函数进行灵活计算的关键字,通过指定分区、排序和行范围,可以对查询结果的特定窗口进行精确的聚合和分析。...ROW_NUMBER() 是一个强大的窗口函数,为查询结果中的行分配唯一的行号,常用于需要为结果集中的行进行排序或排名的场景。...5.3 RANK() RANK() 是 SQL 中的窗口函数,用于为结果集中的行分配一个排名。它与 ROW_NUMBER() 类似,但具有更强的排名功能,能处理并列情况。
) 所有列的唯一值和计数 选择 df[col] 返回一维数组col的列 df[[col1, col2]] 作为新的数据框返回列 s.iloc[0] 按位置选择 s.loc['index_one'] 按索引选择...col列大于0.5的行 df[(df[col] > 0.5) & (1.7)] 0.7> col> 0.5的行 df.sort_values(col1) 将col1按升序对值排序 df.sort_values...,按col1中的值分组(平均值可以用统计部分中的几乎任何函数替换) df.pivot_table(index=col1,values=[col2,col3],aggfunc=max) 创建一个数据透视表...的行具有相同的值。...() 查找每个列中的最大值 df.min() 查找每列中的最小值 df.median() 查找每列的中值 df.std() 查找每个列的标准差 点击“阅读原文”下载此速查卡的打印版本 END.
这种类型的检索例子有: 确定表中行数(或者满足某个条件或包含某个特定值的行数); 获得表中某些行的和; 找出表列(或所有行或某些特定的行)的最大值、最小值、平均值。...使用 COUNT(column) 对特定列中具有值的行进行计数,忽略 NULL 值。...MAX()函数 MAX()返回指定列中的最大值,例子返回 Products 表中最贵物品的价格: SELECT MAX(prod_price) AS max_price FROM Products;...在用于文本数据时,MAX()返回按该列排序后的最后一行。MAX()函数忽略列值为 NULL 的行。...在用于文本数据时,MIN()返回该列排序后最前面的行。MIN()函数忽略列值为 NULL 的行。
Customers ORDER BY Country; ORDER BY DESC 示例 从“Customers”表中选择所有客户,按“Country”列按 DESCENDING 排序: SELECT...这意味着它按国家/地区排序,但如果某些行具有相同的国家/地区,则按 CustomerName 排序: SELECT * FROM Customers ORDER BY Country, CustomerName..., CustomerName DESC; 练习 从Customers表中选择所有记录,按城市列的字母顺序对结果进行排序。...MAX()函数返回所选列的最大值。...JOIN内连接关键字 INNER JOIN关键字选择在两个表中具有匹配值的记录。
sheet(工作表) 查看、检查数据 df.head(n) # 查看DataFrame对象的前n行 df.tail(n) # 查看DataFrame对象的最后n行 df.shape() # 查看行数和列数...df.at[5,"col1"] # 选择索引名称为5,字段名称为col1的数据 df.iat[5,0] # 选择索引排序为5,字段排序为0的数据 data.str.contains("s") # 数据中含有...col列的值大于0.5的行 df.sort_index().loc[:5] #对前5条数据进行索引排序 df.sort_values(col1) # 按照列col1排序数据,默认升序排列 df.sort_values...(index=col1, values=[col2,col3], aggfunc={col2:max,col3:[ma,min]}) # 创建一个按列col1进行分组,计算col2的最大值和col3的最大值...df.mean() # 返回所有列的均值 df.corr() # 返回列与列之间的相关系数 df.count() # 返回每一列中的非空值的个数 df.max() # 返回每一列的最大值 df.min
选择数据库 在创建表之前,首先必须告诉RDBMS您要在其中创建表的数据库。...,它将删除表中保存的所有数据,但不会删除列或表本身: DELETE FROM table; 更改表中的数据 使用以下语法更新给定行中保存的数据。...找到列中的最大值 要按字母顺序查找列中的最大数值或最后一个值,请使用以下MAX函数: SELECT MAX(column) FROM table; 查找列中的最小值 要按字母顺序查找列中的最小数值或第一个值...以下查询语法返回来自column_1和column_2的值,并按升序保存的值对column_1中的结果进行排序,或者对于字符串值,按字母顺序对结果进行排序: SELECT column_1, column...INNER JOIN将返回两个表中具有匹配值的所有记录,但不会显示任何没有匹配值的记录。 通过使用外部 JOIN子句,可以从两个表中的一个表中返回所有记录,包括在另一个表中没有相应匹配的值。
MySQL 5.7 对比 5.6 有很多的变化。一个常见的需求:按条件分组后,取出每组中某字段最大值的那条记录。其实就是组内排序的问题,我的做法是:子查询先进行倒序排序,外层查询分组。...MySQL 扩展了 GROUP BY 的标准 SQL 使用,以便选择列表可以引用 GROUP BY 子句中未命名的非集合列。这意味着前面的查询在 MySQL 中是合法的。...但是,主要是在 GROUP BY 中 未命名的每个非分组列中的所有值对于每个组是相同的,这是有用的。服务器可以自由选择每个组中的任何值,因此除非它们相同,所选择的值是 不确定的。...此外,通过添加 ORDER BY 子句不会影响来自每个组的值的选择。结果集排序发生在选择值后,ORDER BY 不影响 服务选择的每个组中的哪些值。...References MySQL 组内排序取最大值 | mysqlwyett sql - MySQL Group By and Order By; - Stack Overflow MySQL5.7 中的
如果从表中删除某一行,其主键值不分配给新行。 外键约束 外键是表中的一列,其值必须列在另一表的主键中。外键是保证引用完整性的极其重要部分。...提示:外键有助防止意外删除,除帮助保证引用完整性外,外键还有另一个重要作用。在定义外键后,DBMS 不允许删除在另一个表中具有关联行的行。例如,不能删除关联订单的顾客。...检查约束 检查约束用来保证一列(或一组列)中的数据满足一组指定的条件。检查约束的常见用途有以下几点。 ❑ 检查最小或最大值。例如,防止 0 个物品的订单(即使 0 是合法的数)。 ❑ 指定范围。...如果书的内容像字典一样排序,则索引没有必要(因此字典就没有索引)。数据库索引的作用也一样。主键数据总是排序的,这是 DBMS 的工作。因此,按主键检索特定行总是一种快速有效的操作。...❑ 可以在索引中定义多个列(例如,州加上城市)。这样的索引仅在以州加城市的顺序排序时有用。如果想按城市排序,则这种索引没有用处。 提示:检查索引索引的效率随表数据的增加或改变而变化。
为了加快查找的速度,汉语字(词)典一般都有按拼音、笔画、偏旁部首等排序的目录(索引),我们可以选择按拼音或笔画查找方式,快速查找到需要的字(词)。...同理,SQL Server允许用户在表中创建索引,指定按某列预先排序,从而大大提高查询速度。...它为SQL Server提供一种方法来编排查询数据 。 • 索引页:数据库中存储索引的数据页;索引页类似于汉语字(词)典中按拼音或笔画排序的目录页。...索引类型 • 唯一索引:唯一索引不允许两行具有相同的索引值 • 主键索引:为表定义一个主键将自动创建主键索引,主键索引是唯一索引的特殊类型。...唯一索引: 唯一索引不允许两行具有相同的索引值。 如果现有数据中存在重复的键值,则大多数数据库都不允许将新创建的唯一索引与表一起保存。当新数据将使表中的键值重复时,数据库也拒绝接受此数据。
主键(primary key) 有一列(或几列),用于唯一标识表中的每一行。...任何列作为主键的条件: 任意两行都不具有相同的主键值; 每一行都必须具有一个主键值(主键列不允许NULL值); 主键列中的值不允许修改或更新; 主键值不能重用(某行从表中删除,它的主键不能赋给以后的新行...第2章 检索数据 2.1 SELECT语句 用于从一个或多个表中检索信息,必须指定两条信息,想选择什么,从什么地方选择。...关键字(keyword) 作为SQL组成部分的保留字,关键字不能用作表或列的名字。 2.2 检索单个列 用SELECT语句从Products表中检索名为prod_name的列。...屏幕快照 2018-05-25 06.04.04.png 对于上述例子中的输出,仅在多个行具有相同的 prod_price 值时才对产品按prod_name 进行排序。
GROUP BY子句中列出 如果分组中包含具有NULL的行,则NULL将作为一个分组返回;如果列中出现多个NULL,它们将分成一个组 GROUP BY子句必须在WHERE子句之后,ORDER BY子句之前...对产生的输出排序 对行分组,但输出可能不是分组的顺序 任意列都可以使用(非选择的列也可以使用) 只可能使用选择列或者表达式列,而且必须使用每个选择列表达式 不一定需要 如果和聚集函数一起使用列,则必须使用...SELECT子句顺序 在这里总结一下SELECT子句的相关顺序: 子句 说明 是否必须使用 SELECT 要返回的列或者表达式 是 FROM 从中检索数据的表 仅在从表选择数据时使用 WHERE 行级过滤...WHERE子句来指定联结条件,则返回的是笛卡尔积,返回出来数的行就是第一个表中的行乘以第二个表中的行。...AND OI.order_num = O.order_num AND prod_id = 'RGAN01' 3、外联结 有时候我们需要将一个表中的行和另一个表中行相关联,但是有时候也需要包含那些没有关联行的行记录
数据库中的每个列都应该是具有的相同数据类型datatype。数据类型定义了列可以存储哪些数据类型。 行 表中的数据是按照行来进行存储的,所保存的每个记录存储在自己的行内。...如果表中的列可以作为主键,则它必须满足: 任意两行都不具有相同的主键值(主键列不允许NULL值) 每行都必须有一个主键值 主键列中的值不允许修改或者更新 主键值不能重用(如果某行从表中删除,则它的主键不能赋给以后的行记录...如果它不是最后的子句,那么就会报错。 按多个列排序 在实际的需求中,我们经常会遇到根据多个列进行排序。比如根据员工的姓名排序,如果姓相同,再根据名字进行排序。...BY 对产生的输出排序 对行分组,但输出可能不是分组的顺序 任意列都可以使用(非选择的列也可以使用) 只可能使用选择列或者表达式列,而且必须使用每个选择列表达式 不一定需要 如果和聚集函数一起使用列,则必须使用...,其值必须列在另一表的主键中。
NULL 与不匹配 在通过过滤选择出不具有特定值的行时,你可能希望返回具有 NULL 值的行。但是,不行。因为未知具有特殊的含义,数据库不知道它们是否匹配,所以在匹配过滤或不匹配过滤时不返回它们。...因此,在过滤数据时,一定要验证返回数据中确实给出了被过滤列具有 NULL 的行。 计算次序 WHERE 可包含任意数目的 AND 和 OR 操作符。允许两者结合以进行复杂和高级的过滤。...❑ 如果分组列中包含具有 NULL 值的行,则 NULL 将作为一个分组返回。如果列中有多行NULL值,它们将分为一组。...HAVING 和 WHERE 的差别 这里有另一种理解方法,WHERE 在数据分组前进行过滤,HAVING 在数据分组后进行过滤。这是一个重要的区别,WHERE 排除的行不包括在分组中。...在指定一条 ORDER BY 子句时,应该保证它是SELECT语句中最后一条子句,否则这将报错 不限制是否使用非选择列进行排序 除了能用列名指出排序顺序外,ORDER BY 还支持按相对列位置进行排序,
所有的表都是由一个或者多个列组成的。 数据库中的每个列都应该是具有的相同数据类型datatype。数据类型定义了列可以存储哪些数据类型。...如果表中的列可以作为主键,则它必须满足: 任意两行都不具有相同的主键值(主键列不允许NULL值) 每行都必须有一个主键值 主键列中的值不允许修改或者更新 主键值不能重用(如果某行从表中删除,则它的主键不能赋给以后的行记录...如果它不是最后的子句,那么就会报错。 按多个列排序 在实际的需求中,我们经常会遇到根据多个列进行排序。比如根据员工的姓名排序,如果姓相同,再根据名字进行排序。...对产生的输出排序 对行分组,但输出可能不是分组的顺序 任意列都可以使用(非选择的列也可以使用) 只可能使用选择列或者表达式列,而且必须使用每个选择列表达式 不一定需要 如果和聚集函数一起使用列,则必须使用...,其值必须列在另一表的主键中。
列是表中的某个字段。所有的表都是由一个或者多个列组成的。 数据库中的每个列都应该是具有的相同数据类型datatype。数据类型定义了列可以存储哪些数据类型。...行 表中的数据是按照行来进行存储的,所保存的每个记录存储在自己的行内。如果把表想象成一个网格,那么网格中垂直的列则为表列,水平则为表行。 行表示的是一个记录。行有时候也称之为记录。...主键 表中每一行都应该都有一列或者几列来唯一标识自己。主键用来表示一个特定的行。 主键:一列或者几列,其值能够标识表中每行。...如果表中的列可以作为主键,则它必须满足: 任意两行都不具有相同的主键值(主键列不允许NULL值) 每行都必须有一个主键值 主键列中的值不允许修改或者更新 主键值不能重用(如果某行从表中删除,则它的主键不能赋给以后的行记录...如果它不是最后的子句,那么就会报错。 按多个列排序 在实际的需求中,我们经常会遇到根据多个列进行排序。比如根据员工的姓名排序,如果姓相同,再根据名字进行排序。
领取专属 10元无门槛券
手把手带您无忧上云