首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

python df 列替换_如何用Python做数据分析,没有比这篇文章更详细了(图文详情)...

数据表检查另一个目的是了解数据概况,例如整个数据表大小,所占空间,数据格式,是否有空重复和具体数据内容。后面的清洗和预处理做好准备。  ...类似 Excel 删除重复结果。  ...“删除重复功能,可以用来删除数据表重复。...我们数据表 city 列为例,city 字段存在重复。默认情况下 drop_duplicates()删除后出现重复( excel 逻辑一致)。...Where 函数用来对数据进行判断和分组,下面的代码我们对 price 列进行判断,符合条件分为一组,不符合条件分为另一组,并使用 group 字段进行标记。

4.4K00
您找到你想要的搜索结果了吗?
是的
没有找到

MySQL基础(快速复习版)

on 连接条件where 筛选条件group by 分组列表having 分组筛选order by 排序列表limit 子句; 特点: ①查询结果=主表中所有的行,如果从表和它匹配显示匹配行...into 表名(字段名,...) values(,...); 特点: 1、要求值类型和字段类型要一致或兼容 2、字段个数和顺序不一定原始表字段个数和顺序一致 但必须保证字段一一对应...NOT NULL:,该字段必填 UNIQUE:唯一,该字段不可重复 DEFAULT:默认,该字段不用手动插入有默认 CHECK:检查,mysql不支持 PRIMARY KEY:主键,...该字段不可重复并且 unique+not null FOREIGN KEY:外键,该字段引用了另外字段 主键和唯一 1、区别: ①、一个表至多有一个主键,但可以有多个唯一 ②、主键不允许...,中间用空格隔开,没有顺序要求 三、修改表时添加或删除约束 1、 添加 alter table 表名 modify column 字段字段类型 not null; 删除非 alter table

4.5K20

快速学完数据库管理

,候选键只有一个属性或者全部属性才能构成一个候选键 6.关系数据库数据完整性 -- 实体完整性 --即主键值唯一且不能为 -- 参照完整性 --一个表外键值要么要么就是其他表某一个主键值...等值连接 --条件运算符是等号连接 等值连接 即一般条件判断连接,符合规则然后连接 --还有一些概念,例如左外连接,右外连接,全外连接,即连接时如果没有匹配一些处理,没有部分置...ALTER TABLE student add constraint key PRIMARY key(sno) 约束 作用:使得插入数据不能为 --这里就是创建了一个约束 create...,数据按照一定原则进行排序 --涉及到几个比较常见聚集函数 --count,min,max,avg,sum --count(*)代表统计全部数据包括,count(具体列名)则代表数据...sql语句 相关子查询 --顾名思义就是子查询主要查询直接有关系 --例如 一些注意事项 -- between and 包括范围点 -- like匹配匹配中文时也中文看成一个字符 -

1.9K30

MySQLPython交互入门

表示在一个连续范围内 eg:where id in (8, 10, 13) f、判断 注意:null""是不同 判断:is null...b、max(列) 表示求此列最大 c、min(列) 表示求此列最小 d、sum(列) 表示求此列和 e、avg(列) 表示求此列平均值5、分组...按照字段分组,表示此字段相同数据会被放到一个集合。...B匹配行会出现在结果集中 2、表A left join 表B 表A表B匹配行会出现在结果集中,外加表A独有的数据,未对应数据使用null填充 3、表A right join...表B 表A表B匹配行会出现在结果集中,外加表B独有的数据,未对应数据使用null填充 交互 进行pythonmysql交互需要安装pymysql库,安装也很简单,常规pip

1.5K20

pandas技巧4

() # 检查DataFrame对象,并返回一个Boolean数组 pd.notnull() # 检查DataFrame对象,并返回一个Boolean数组 df.dropna() #...删除所有包含行 df.dropna(axis=1) # 删除所有包含列 df.dropna(axis=1,thresh=n) # 删除所有小于n个行 df.fillna(value=...x) # 用x替换DataFrame对象中所有的,支持df[column_name].fillna(x) s.astype(float) # Series数据类型更改为float类型 s.replace...') # df2列添加到df1尾部,对应行对应列都不要 df1.join(df2.set_index(col1),on=col1,how='inner') # 对df1列和df2列执行...df.mean() # 返回所有列均值 df.corr() # 返回列列之间相关系数 df.count() # 返回每一列个数 df.max() # 返回每一列最大 df.min

3.4K20

MySQL数据库、数据表基本操作及查询数据

[CONSTRAINT] FOREIGN KEY 字段1[,字段2...] REFERENCES 主键列1[,主键列2...] 使用约束 约束指字段不能为。...对于使用了约束字段,如果用户在添加数据时没有指定,数据库系统会报错。 字段名 数据类型 NOT NULL 使用唯一性约束 唯一性约束要求该列唯一,允许,但只能出现一个。...,字段名n] FROM 表名 WHERE 查询条件; 带 IN关键字查询 IN操作符用来查询满足指定范围内条件记录,使用 IN操作符,所有检索条件用括号括起来,检索条件之间用逗号隔开,只要满足条件范围内一个即为匹配...百分号通配符 %,匹配任意长度字符,甚至包括零字符。 下划线通配符 _ ,一次只能匹配任意一个字符。 查询 不同于0,也不同于空字符串。一般表示数据未知、不适用或将在以后添加数据。...带 EXISTS关键字子查询 EXISTS关键字后面的参数是一个任一子查询,系统对子查询进行运算判断它是否返回行,如果至少返回一行,那么 EXISTS结果 true,此时外层查询语句进行查询

3K20

Mysql基础

< 大于等于 BETWEEN 在两个之间 IS NULL NULL 应该注意到,NULL 0、空字符串都不同。 AND 和 OR 用于连接多个过滤条件。...IN 操作符用于匹配一组,其后也可以接一个 SELECT 子句,从而匹配子查询得到一组。 NOT 操作符用于否定一个条件。 十、通配符 通配符也是用在过滤语句中,但它只能用于文本字段。...十三、分组 分组就是把具有相同数据行放在同一组。 可以对同一分组数据使用汇总函数进行处理,例如求分组数据平均值等。 指定分组字段除了能按该字段进行分组,也会自动按该字段进行排序。...预读过程,磁盘进行顺序读取,顺序读取不需要进行磁盘寻道,并且只需要很短旋转时间,速度会非常快。 操作系统一般内存和磁盘分割成固定大小块,每一块称为一页,内存磁盘单位交换数据。...当线程A要更新数据时,在读取数据同时也会读取version,在提交更新时,若刚才读取到version当前数据库version相等时才更新,否则重试更新操作,直到更新成功。

1.8K00

SQL命令 DISTINCT

不能按列别名指定字段;尝试这样做会生成SQLCODE-29错误。不能按列号指定字段;这将被解释文字,并返回一行。文字指定为DISTINCT子句中返回1行;返回哪行是不确定。...可以使用子查询实现DISTINCT、聚合函数和GROUP BY预期组合。 字母大小写DISTINCT优化 根据字段定义排序规则类型,字符串不同地分组在一起。...默认情况下,字符串数据类型字段使用SQLUPPER排序规则定义,该排序规则不区分大小写。 如果字段/特性排序规则类型SQLUPPER,则分组字段全部大写字母返回。...DISTINCT BY(StreamField)字段记录数减少到一个记录。 星号语法:DISTINCT*语法是合法,但没有意义,因为根据定义,所有行都包含一些不同唯一标识符。...如果SELECT包含FROM子句,则在一行中指定DISTINCT结果包含这些;如果未指定DISTINCT(或TOP),则SELECT产生FROM子句表行数相同行数。

4.3K10

Mysql基础

< 大于等于 BETWEEN 在两个之间 IS NULL NULL 应该注意到,NULL 0、空字符串都不同。 AND 和 OR 用于连接多个过滤条件。...IN 操作符用于匹配一组,其后也可以接一个 SELECT 子句,从而匹配子查询得到一组。 NOT 操作符用于否定一个条件。 十、通配符 通配符也是用在过滤语句中,但它只能用于文本字段。...十三、分组 分组就是把具有相同数据行放在同一组。 可以对同一分组数据使用汇总函数进行处理,例如求分组数据平均值等。 指定分组字段除了能按该字段进行分组,也会自动按该字段进行排序。...预读过程,磁盘进行顺序读取,顺序读取不需要进行磁盘寻道,并且只需要很短旋转时间,速度会非常快。 操作系统一般内存和磁盘分割成固定大小块,每一块称为一页,内存磁盘单位交换数据。...当线程A要更新数据时,在读取数据同时也会读取version,在提交更新时,若刚才读取到version当前数据库version相等时才更新,否则重试更新操作,直到更新成功。

1.5K00

数据库查询常用语句语法

sql 语句中 有时候1 代表对应 第一个字段,第二个字段 一次类推。 去除重复 distinct() 只能放在开头 一般作用一个元素。...group by 分组表达式 指定 GROUP BY 时,先排序后分组,选择列表任一聚合表达式内所有列都应包含在 GROUP BY 列表(没有群组函数都应该包含在group by)或者 GROUP...放在两个select中间,只是两个结果联结起来一起显示,并不是联结两个表UNION ALL 这个指令目的也是要将两个 SQL 语句结果合并在一起。...tableName limit i,n # tableName:表名 # i:查询结果索引(默认从0开始),当i=0时可省略i # n:查询结果返回数量 # in之间使用英文逗号”...end相匹配 列出爵士獲獎者、年份、獎頁(爵士名字Sir開始)。

89230

基础篇:数据库 SQL 入门教程

但是由于各种各样数据库出现,导致很多不同版本 SQL 语言,为了 ANSI 标准相兼容,它们必须相似的方式共同地来支持一些主要关键词(比如 SELECT、UPDATE、DELETE、INSERT...语法: UPDATE 表名称 SET 列名称 = 新 WHERE 列名称 = 某; 实例: 更新某一行一个列: 目前 Persons 表有很多字段 null 数据,可以通过 UPDATE ...数据库表可通过键彼此联系起来。主键(Primary Key)是一个列,在这个列每一行都是唯一。在表,每个主键都是唯一。...同时,每条 SELECT 语句中顺序必须相同。 NOT NULL – NOT NULL 约束强制列不接受 NULL 。 NOT NULL 约束强制字段始终包含。...VIEW – 视图 在 SQL ,视图是基于 SQL 语句结果集可视化表。 视图包含行和列,就像一个真实表。视图中字段就是来自一个或多个数据库真实字段

8.9K10

从Excel到Python:最常用36个Pandas函数

数据表检查 数据表检查目的是了解数据表整体情况,获得数据表关键信息、数据概况,例如整个数据表大小、所占空间、数据格式、是否有 重复和具体数据内容,后面的清洗和预处理做好准备。...Isnull是Python检验函数 #检查数据 df.isnull() ? #检查特定列 df['price'].isnull() ?...6.删除重复 Excel数据目录下有“删除重复功能 ?...在Python中使用split函数实现分列在数据表category列数据包含有两个信息,前面的数字类别id,后面的字母size。中间连字符进行连接。...Python通过pivot_table函数实现同样效果 #设定city字段,size字段,price字段。 分别计算price数量和金额并且按行列进行汇总。

11.3K31

两万字图文 SQL 零基础入门,不怕你学不会,就怕你不收藏!❤️

NOT NULL – ???? VIEW – 视图 ???? SQL 常用函数学习 ???? AVG – 平均值 ???? COUNT – 汇总行数 ???? MAX – 最大 ????...语法: UPDATE 表名称 SET 列名称 = 新 WHERE 列名称 = 某; 实例: 更新某一行一个列: 目前 Persons 表有很多字段 null 数据,可以通过 UPDATE ...数据库表可通过键彼此联系起来。主键(Primary Key)是一个列,在这个列每一行都是唯一。在表,每个主键都是唯一。...NOT NULL – NOT NULL 约束强制列不接受 NULL 。 NOT NULL 约束强制字段始终包含。这意味着,如果不向字段添加值,就无法插入新记录或者更新记录。...VIEW – 视图 在 SQL ,视图是基于 SQL 语句结果集可视化表。 视图包含行和列,就像一个真实表。视图中字段就是来自一个或多个数据库真实字段

8.3K10

所谓数据质量

区分规则维度有助于: 维度业务需求相匹配,并且划分评估先后顺序; 了解从每一维度评估能够/不能够得到什么; 在时间和资源有限情况下,更好地定义和管理项目计划行动顺序。...如客户开户时,客户名称是必填,不能出现为情况。 约束 约束比较容易理解,简单讲就是字段不能为检查方式也比较容易,只需要设定需要检查字段,通过 sql 查询列不能为即可。...将为数据查询出来进行整改。 当然约束可以通过设置约束方式限制数据无法写入数据库,如果支持这种方式可以避免事后数据检查。 ?...这种情况的如果是单一业务主键,可以通过对主键分组去重方式检查,如果是业务联合属性判断唯一实体情况只能业务人员进行手动检查。 ?...如“金融机构编码”在《人民银行金融机构编码规范》规定长度14位,如果出现14位,则判定为不满足长度约束,不是一个有效“金融机构编码”; 内容规范约束:描述检核对象是否按照一定要求和规范进行数据录入存储

1.6K20

MySQL数据库编程基础入门2

NULL但是实际也是插入NULL; 主键约束:默认就是不能为并且唯一,一张表只能有一个主键,常常供外键使用 (2) 外键约束 描述:外键是搭配主键使用可以为(看做主键子集),若不为则每一个外键值必须等于另外一个表主键...:用于约束对应列默认,除非默认否则不可以插入; CREATE TABLE IF NOT EXISTS T2 ( name VARCHAR(10) NOT NULL, sex...(WHERE排除数据不参加分组),而分组HAVING可以直接接聚合函数在分组之后过滤数据; 注:总结出查询SQL语句编写顺序:SELECT ....原子DDL语句数据字典更新,存储引擎操作以及DDL操作关联二进制日志写入操作组合到单个原子事务。...,而后者一条一条删除表数据):执行速度,隐式提交因此无法回滚,只要表定义有效即使数据或索引文件已损坏也能重新创建空白表,AUTO_INCREMENT重置其初始,不调用ON DELETE触发器

1.4K10

Mysql常用查询语句

= 六利用变量查询数值型数据 SELECT * FROM tb_name WHERE id = ‘$_POST[text]’ 注:利用变量查询数据时,传入SQL变量不必用引号括起来,因为PHP字符串数值型数据进行连接时... WHERE 查询条件 注:SQL语句中DISTINCT必须WHERE子句联合使用,否则输出信息不会有变化 ,且字段不能用*代替 十六NOT谓词进行组合条件查询 (1)NOT BERWEEN... … AND … 对介于起始和终止数据时行查询 可改成 终止 (2)IS NOT NULL 对进行查询 (3)IS NULL 对空进行查询 (4)NOT IN...二十对统计结果进行排序 函数SUM([ALL]字段名) 或 SUM([DISTINCT]字段名),可实现对字段求和,函数ALL时所有该字段所有记录求和,若为DISTINCT则为该字段所有不重复记录字段求和... by排序语句order by同时出现在SQL语句中时,要将分组语句书写在排序语句前面,否则会出现错误 二十二多列数据分组统计 多列数据分组统计单列数据分组统计类似 SELECT *,SUM(字段

5.1K20

数据库技术:MySQL 基础和 SQL 入门,单表、约束和事务

服务器 Database Tables 数据库组织单位存储数据 表类似 Java 类,每个字段都有对应数据类型 对比 Java 程序关系型数据库 类 = 表 类属性 = 表字段 对象...SQL 语句可以单行或者多行书写,分号结尾 ; (Sqlyog 可以不用写分号,但建议加上) 可以使用空格和缩进来增加语句可读性。...违反约束不正确数据,无法插入到表。 Primary Key -- 主键约束 主键约束是不可重复、唯一,用来表示数据库每一条记录。...约束特点:某一列不予许。...主键约束唯一约束区别:1. 主键约束是唯一且不能够为,唯一约束是唯一但可以为;2. 一个表只能有一个主键,但是可以有多个唯一约束。

1.5K20

数据库基础知识一(MySQL)

(返回指定小数位数表达式),sign(返回某个数符号),sin(返回弧度单位角度正弦),sqrt,tan show databases;语句查看MySQL服务器所有数据库...all是默认,distinct取消结果集中重复行。 group by用于对查询结果根据grouping_columns进行分组。...(一个字段是否,要表示“is null”或“is not null”),不能表示=null或null。...左外连接left outer join:返回指定左表全部行+右表对应行,如果左表数据在右表没有与其匹配行,则再查询结果集中相应位置显示。...右外连接Right Outer Join 右外连接right outer join:返回指定右表全部行+左表对应行,如果右表数据在左表没有与其匹配行,则再查询结果集中相应位置显示

1.6K20

常用SQL查询语句,值得回看不要错过,好记性不如多看看!

= 六、利用变量查询数值型数据 SELECT * FROM tb_name WHERE id = ‘$_POST[text]’ 注:利用变量查询数据时,传入SQL变量不必用引号括起来,因为PHP字符串数值型数据进行连接时...字段名 FROM 表名 WHERE 查询条件 注:SQL语句中DISTINCT必须WHERE子句联合使用,否则输出信息不会有变化 ,且字段不能用*代替 十六、NOT谓词进行组合条件查询 (1...)NOT BERWEEN … AND … 对介于起始和终止数据时行查询 可改成 终止 (2)IS NOT NULL 对进行查询 (3)IS NULL 对空进行查询...二十、对统计结果进行排序 函数SUM([ALL]字段名) 或 SUM([DISTINCT]字段名),可实现对字段求和,函数ALL时所有该字段所有记录求和,若为DISTINCT则为该字段所有不重复记录字段求和...by排序语句order by同时出现在SQL语句中时,要将分组语句书写在排序语句前面,否则会出现错误 二十二、多列数据分组统计 多列数据分组统计单列数据分组统计类似 SELECT *,SUM(字段1

2.8K30
领券