首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    MySQL表的增删改查(进阶)

    CREATE TABLE student ( id INT NOT NULL, name VARCHAR(20) NOT NULL ); UNIQUE:唯一约束 UNIQUE:确保某列的每行数据唯一...PRIMARY KEY AUTO_INCREMENT, name VARCHAR(20) DEFAULT 'Unknown' ); PRIMARY KEY:主键约束 PRIMARY KEY:确保某列或多列数据唯一...SELECT 列名1, 聚合函数(列名) FROM 表名 WHERE 条件 GROUP BY 列名1; ​ 列名1 是用来分组的列。GROUP BY将结果按照这些列的值进行分组。...聚合函数(列名):用于执行分组后的聚合计算(如COUNT()、SUM()、AVG()等)。 WHERE:过滤数据,通常在GROUP BY之前使用,来限制参与分组的数据。...注意select 指定的列必须是“分组依据列” (指定列中相同的行为一组),其他列若想出现在select 中则必须包含在聚合函数中,否则会出现错误 (假如一组中有3行,该组内部都为不同的值,那该组的列展示出来的就是其中的一个值

    6310

    从pandas中的这几个函数,我看懂了道家“一生二、二生三、三生万物”

    01 nunique number of unique,用于统计各列数据的唯一值个数,相当于SQL语句中的count(distinct **)用法。...例如,想统计前面数据表中开课的个数,则可用如下语句: ? 02 unique nunique用于统计唯一值个数,而unique则用于统计唯一值结果序列。...正因为各列的返回值是一个ndarray,而对于一个dataframe对象各列的唯一值ndarray长度可能不一致,此时无法重组成一个二维ndarray,从这个角度可以理解unique不适用于dataframe...当然,groupby的强大之处在于,分组依据的字段可以不只一列。例如想统计各班每门课程的平均分,语句如下: ? 不只是分组依据可以用多列,聚合函数也可以是多个。...数据透视表本质上仍然数据分组聚合的一种,只不过是以其中一列的唯一值结果作为行、另一列的唯一值结果作为列,然后对其中任意(行,列)取值坐标下的所有数值进行聚合统计,就好似完成了数据透视一般。

    2.5K10

    python数据科学系列:pandas入门详细教程

    自然毫无悬念 dataframe:无法访问单个元素,只能返回一列、多列或多行:单值或多值(多个列名组成的列表)访问时按列进行查询,单值访问不存在列名歧义时还可直接用属性符号" ....unique、nunique,也是仅适用于series对象,统计唯一值信息,前者返回唯一值结果列表,后者返回唯一值个数(number of unique) ?...;sort_values是按值排序,如果是dataframe对象,也可通过axis参数设置排序方向是行还是列,同时根据by参数传入指定的行或者列,可传入多行或多列并分别设置升序降序参数,非常灵活。...groupby,类比SQL中的group by功能,即按某一列或多列执行分组。...例如,以某列取值为重整后行标签,以另一列取值作为重整后的列标签,以其他列取值作为填充value,即实现了数据表的行列重整。

    14.9K20

    数据导入与预处理-第6章-02数据变换

    转换函数如: 其中 max为样本数据的最大值,min为样本数据的最小值。max-min为极差。 以一个例子说明标准化的计算过程。...基于列值重塑数据(生成一个“透视”表)。使用来自指定索引/列的唯一值来形成结果DataFrame的轴。此函数不支持数据聚合,多个值将导致列中的MultiIndex。...pivot_table透视的过程如下图: 假设某商店记录了5月和6月活动期间不同品牌手机的促销价格,保存到以日期、商品名称、价格为列标题的表格中,若对该表格的商品名称列进行轴向旋转操作,即将商品名称一列的唯一值变换成列索引...,将出售日期一列的唯一值变换成行索引。...,商品一列的唯一数据变换为列索引: # 将出售日期一列的唯一数据变换为行索引,商品一列的唯一数据变换为列索引 new_df = df_obj.pivot(index='出售日期', columns='商品名称

    19.3K20

    【MySQL】表的增删查改(进阶)

    数据库约束 约束类型 NOT NULL 指示某列不能存储NULL值. UNIQUE 保证某列的每行必须有唯一的值。 数据库如何判定,当前这一条记录是重复的?先查找,再插入。...一对多 4.多对多) 根据上述内容,套入到固定的“公式”中,然后就可以得到表。 一对一关系 在教务系统中,有一个实体,学生,还有一个实体,账号。...(相当于复制粘贴~) 查询 聚合查询 本质上是在针对行和行之间进行计算。...GROUP BY 子句 使用group by 对表中的行进行分组 不用group by分组的时候,相当于只有一组。引入group by就可以针对不同的组来分别进行聚合。...先计算笛卡尔积 引入连接条件 再根据需求,加入必要的条件。 把不必要的列去掉 联合查询,还有一种写法。

    3.1K20

    【数据库设计和SQL基础语法】--查询数据--聚合函数

    2.4 MIN 基本用法 MIN 函数用于计算查询结果集中某列的最小值。...聚合函数计算的结果列别名可用于提高结果的可读性。 GROUP BY 子句是 SQL 中用于分组数据并应用聚合函数的关键元素。...3.2 聚合函数与 GROUP BY 结合使用 在 SQL 中,聚合函数与 GROUP BY 子句结合使用,用于对数据进行分组并对每个分组应用聚合函数,从而得到按组计算的结果。...SUM: 计算每个分组中某列的总和。 AVG: 计算每个分组中某列的平均值。 MIN: 找出每个分组中某列的最小值。 MAX: 找出每个分组中某列的最大值。...使用 GROUP BY 替代: 如果需要对多列进行去重,考虑使用 GROUP BY 子句,并选择合适的聚合函数。

    61210

    【数据库设计和SQL基础语法】--查询数据--聚合函数

    2.4 MIN 基本用法 MIN 函数用于计算查询结果集中某列的最小值。...聚合函数计算的结果列别名可用于提高结果的可读性。 GROUP BY 子句是 SQL 中用于分组数据并应用聚合函数的关键元素。...3.2 聚合函数与 GROUP BY 结合使用 在 SQL 中,聚合函数与 GROUP BY 子句结合使用,用于对数据进行分组并对每个分组应用聚合函数,从而得到按组计算的结果。...SUM: 计算每个分组中某列的总和。 AVG: 计算每个分组中某列的平均值。 MIN: 找出每个分组中某列的最小值。 MAX: 找出每个分组中某列的最大值。...使用 GROUP BY 替代: 如果需要对多列进行去重,考虑使用 GROUP BY 子句,并选择合适的聚合函数。

    62110

    推荐学Java——数据表操作

    唯一约束:unique 约束的字段不能重复,但可以为 NULL . -- 多个列联合约束 这种约束叫做 表级约束 create table 表名( id int not null unique...也可以给列名加别名,像下面这样 select 表名的别名.列名1 列名1的别名,表名的别名.列名2 列名2的别名 from 表名 表名的别名; 去重查询 // 查询表中某列数据,并去掉重复值...by 将表中某列值相同的记录放在一起,称为一组。...表名 group by 列名; // 按照某列排序,并统计该列的数量 select 列名,count(列名) from 表名 group by 列名; // 两个字段联合一起查询,示例:查找各部分...='寒冰',sage=23 where sid=105; 更新所有记录的某些列 update 表名 set 要更新的列1=值1,要更新的列2=值2; 总结 表的操作,根据个人职位和功能需求来定

    2.6K20

    视图和索引(数据库学习)

    -|:视图中被修改的列必须直接引用表列中的基础数据(非聚合函数、计算、集合运算) -|:被修改的列不应是创建视图时受group by、having、distinct、top语句影响的。...索引的分类。创建索引时应考虑哪些问题? 索引(index):是对数据库表中一个或多个列的值进行排序的结构 ,其主要目的是提高SQL Server 系统的性能,加快查询数据的速度。...(目录纯粹是目录,正文纯粹是正文) 创建索引时应考虑的问题 -|:对一个表中建大量的索引,应经行权衡。(经常更新少索引,更新少的数据量大的多索引)。...-|:对于主键和外键列应考虑建索引。(主键查询、外键连接) -|:很少在查询中使用的列及值很少的列不应考虑建索引。...(unique)非聚集唯一索引。

    1.1K30

    MySQL表的增删查改(二)

    数据库约束 1.约束类型 NOT NULL - 指示某列不能存储 NULL 值。 UNIQUE - 保证某列的每行必须有唯一的值。 DEFAULT - 规定没有给列赋值时的默认值。...PRIMARY KEY - NOT NULL 和 UNIQUE 的结合。确保某列(或两个列多个列的结合)有唯一标识,有助于更容易更快速地找到表中的一个特定的记录。...,自增长auto_increment插入数据对应字段不给值时,使用最大值+1 sn INT UNIQUE, #UNIQUE 唯一约束 name VARCHAR(20) DEFAULT...三大范式: 第一范式(1NF): 第一范式是指数据库表的每一列都是不可分割的基本数据项,同一列中不能有多个值,即实体中的某个属性不能有多个值,或不能有重复的属性。...需要满足:使用 GROUP BY 进行分组查询时,SELECT 指定的字段必须是“分组依据字段”,其他字段若想出现在SELECT 中则必须包含在聚合函数中。

    2.5K10

    用 Pandas 进行数据处理系列 二

    [‘b’].unique()查看某一列的唯一值df.values查看数据表的值df.columns查看列名df.head()查看默认的前 10 行数据df.tail()查看默认的后 10 行数据 数据表清洗..., group 列显示 hight , 否则显示 low df['group'] = np.where(df['pr'] > 3000, 'hight', 'low') 对复合多个条件的数据进行分级标记...df.loc[(df['city'] == 'beijing') & (df['pr'] >= 4000), 'sign'] = 1 对 category 字段的值依次进行分列,并创建数据表,索引值...city 进行分组,然后计算 pr 列的大小、总和和平均数 数据统计 数据采样,计算标准差、协方差和相关系数。...,T 表示转置 计算列的标准差 df['pr'].std() 计算两个字段间的协方差 df['pr'].cov(df['m-point']) 计算表中所有字段间的协方差 df.cov() 两个字段间的相关性分析

    8.2K30

    用 MySQL DISTINCT 轻松消灭所有重复数据的秘诀

    它可以应用于单列或多列,并可与聚合函数(如 COUNT)结合使用,以统计唯一值的数量。 基本用法 SELECT DISTINCT column1, column2, ......分组后聚合统计去重 SELECT city, COUNT(DISTINCT name) AS unique_users FROM users GROUP BY city; 输出结果 city unique_users...作用于所有列: DISTINCT关键字作用于查询结果的所有列。如果你只想要某一列的唯一值,但仍然在SELECT语句中列出了其他列,那么这些列的值也会被考虑在内,以确定行的唯一性。...与聚合函数结合使用: 虽然DISTINCT通常用于去除重复行,但它也可以与某些聚合函数(如COUNT)结合使用,以计算唯一值的数量。...这可以通过ORDER BY和GROUP BY子句来实现。但是,请注意,GROUP BY通常与聚合函数一起使用,而DISTINCT则用于去除重复行。

    31410

    数据分析之Pandas分组操作总结

    之前介绍过索引操作,现在接着对Pandas中的分组操作进行介绍:主要包含SAC含义、groupby函数、聚合、过滤和变换、apply函数。...分组函数的基本内容: 根据某一列分组 根据某几列分组 组容量与组数 组的遍历 level参数(用于多级索引)和axis参数 a)....根据某几列分组 grouped_mul = df.groupby(['School','Class']) grouped_mul.get_group(('S_2','C_4')) ? c)....过滤(Filtration):即按照某些规则筛选出一些组:输入的是每组数据,输出的是满足要求的组的所有数据。 问题6. 在带参数的多函数聚合时,有办法能够绕过wrap技巧实现同样功能吗?...(单变量的简单线性回归,并只使用Pandas和Numpy完成) df['ones']=1 colors=['G','E','F','H','D','I','J'] for c in colors:

    7.9K41

    Python pandas十分钟教程

    统计某列数据信息 以下是一些用来查看数据某一列信息的几个函数: df['Contour'].value_counts() : 返回计算列中每个值出现次数。....unique():返回'Depth'列中的唯一值 df.columns:返回所有列的名称 选择数据 列选择:如果只想选择一列,可以使用df['Group']....这里'Group'是列名。 要选择多个列,可以使用df[['Group', 'Contour', 'Depth']]。 子集选择/索引:如果要选择特定的子集,我们可以使用.loc或.iloc方法。...数据清洗 数据清洗是数据处理一个绕不过去的坎,通常我们收集到的数据都是不完整的,缺失值、异常值等等都是需要我们处理的,Pandas中给我们提供了多个数据清洗的函数。...Pandas中提供以下几种方式对数据进行分组。 下面的示例按“Contour”列对数据进行分组,并计算“Ca”列中记录的平均值,总和或计数。

    9.8K50

    我的Python分析成长之路9

    1.Series:Series是一种一维的数组型对象,它包含一个值序列,并含有数据标签。...9 print(df5.rank(method='first')) #按照值在数据中出现的次序分配排名 4.删除某列或某行的数据       DataFrame.drop(label,axis=0,...1.数值型特征的描述性统计     数值型特征的描述性统计主要包括了计算数值型数据的完整情况、最小值、均值、中位数、最大值、四分位数、极差、标准差、方差、协方差和变异系数。     ...:计算Series或DataFrame各列的汇总统计集合     pct_change:计算百分比     2.类别型数据的描述性统计     描述类别型特征的分布状况,可以使用频数统计表     value_count...:返回一个Series,索引是唯一值序列,值是计数个数,按照个数降序排序 ?

    2.1K11

    groupby函数详解

    1 groupby()核心用法 (1)根据DataFrame本身的某一列或多列内容进行分组聚合,(a)若按某一列聚合,则新DataFrame将根据某一列的内容分为不同的维度进行拆解,同时将同一维度的再进行聚合...,(b)若按某多列聚合,则新DataFrame将是多列之间维度的笛卡尔积,即:新DataFrame具有一个层次化索引(由唯一的键对组成),例如:“key1”列,有a和b两个维度,而“key2”有one和...DataFrame本身的某一列或多列内容进行分组聚合 #创建原始数据集 import pandas as pd import numpy as np df=pd.DataFrame({ 'key1...) 按key1、key2进行分组,并计算data1列的平均值,聚合表不堆叠 #将数据从“花括号”格式转为“表格”格式,unstack即“不要堆叠” df2=df['data1'].groupby([df...,并希望根据分组计算列的总计: #创建分组的映射字典 mapping={ 'a':'red','b':'red','c':'blue','d':'blue','e':'red','f':'orange

    3.8K11

    快速介绍Python数据分析库pandas的基础知识和代码示例

    NaN(非数字的首字母缩写)是一个特殊的浮点值,所有使用标准IEEE浮点表示的系统都可以识别它 pandas将NaN看作是可互换的,用于指示缺失值或空值。...通常回根据一个或多个列的值对panda DataFrame进行排序,或者根据panda DataFrame的行索引值或行名称进行排序。 例如,我们希望按学生的名字按升序排序。...计算性别分组的所有列的平均值 average = df.groupby(‘Sex’).agg(np.mean) ? 统计数据 我们可能熟悉Excel中的数据透视表,可以轻松地洞察数据。...假设我们想按性别将值分组,并计算物理和化学列的平均值和标准差。...我们将调用pivot_table()函数并设置以下参数: index设置为 'Sex',因为这是来自df的列,我们希望在每一行中出现一个唯一的值 values值为'Physics','Chemistry

    8.1K20
    领券