首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【Python】基于某些删除数据框重复

subset:用来指定特定,根据指定对数据框去重。默认为None,即DataFrame中一行元素全部相同时才去除。...导入数据处理库 os.chdir('F:/微信公众号/Python/26.基于组合删除数据框重复') #把路径改为数据存放路径 name = pd.read_csv('name.csv...new_name_3 = name.drop_duplicates(subset='name1',inplace=True) new_name_3 结果new_name_3为空,即设置inplace...原始数据只有第二行和最后一行存在重复,默认保留第一条,故删除最后一条得到新数据框。 想要根据更多数去重,可以在subset添加。...但是对于两中元素顺序相反数据框去重,drop_duplicates函数无能为力。 如需处理这种类型数据去重问题,参见本公众号文章【Python】基于组合删除数据框重复。 -end-

18K31

【Python】基于组合删除数据框重复

最近公司在做关联图谱项目,想挖掘团伙犯罪。在准备关系数据时需要根据两组合删除数据框重复,两中元素顺序可能是相反。...二、基于删除数据框重复 1 加载数据 # coding: utf-8 import os #导入设置路径库 import pandas as pd #导入数据处理库...import numpy as np #导入数据处理库 os.chdir('F:/微信公众号/Python/26.基于组合删除数据框重复') #把路径改为数据存放路径 df =...由于原始数据是从hive sql跑出来,表示商户号之间关系数据,merchant_r和merchant_l存在组合重复现象。现希望根据这两组合消除重复项。...numpy as np #导入数据处理库 os.chdir('F:/微信公众号/Python/26.基于组合删除数据框重复') #把路径改为数据存放路径 name = pd.read_csv

14.6K30
您找到你想要的搜索结果了吗?
是的
没有找到

如何使用Excel将某几列有标题显示到新

如果我们有好几列有内容,而我们希望在新中将有内容标题显示出来,那么我们怎么做呢? Excel - TEXTJOIN function 1....- - - - 4 - - - 在开始,我们曾经使用INDEX + MATCH方式,但是没有成功,一直是N/A https://superuser.com/questions/1300246/if-cell-contains-value-then-column-header...所以我们后来改为TEXTJOIN函数,他可以显示,也可以显示标题,还可以多个列有时候同时显示。...- - 4 - - - 15 Year 5 - - - - 5 - - - =TEXTJOIN(", ",TRUE,IF(ISNUMBER(B2:I2),$B$1:$I$1,"")) 如果是想要显示,...则: =TEXTJOIN(", ",TRUE,IF(ISNUMBER(B2:I2),B2:I2,"")) 其中,ISNUMBER(B2:I2)是判断是不是数字,可以根据情况改成是不是空白ISBLANK

11.3K40

SQL NULL :定义、测试和处理空数据,以及 SQL UPDATE 语句使用

SQL NULL 什么是 NULL ? NULL 是指字段没有情况。如果表字段是可选,那么可以插入新记录或更新记录而不向该字段添加值。此时,该字段将保存为 NULL 。...需要注意是,NULL 与零或包含空格字段不同。具有 NULL 字段是在记录创建期间留空字段。 如何测试 NULL 使用比较运算符(=、)无法测试 NULL 。...以下 SQL 列出了所有具有 "Address" 字段 NULL 客户: SELECT CustomerName, ContactName, Address FROM Customers WHERE...使用 IS NULL 和 IS NOT NULL 运算符可以有效地处理数据库情况。 SQL UPDATE 语句 UPDATE 语句用于修改表现有记录。...UPDATE 语法 UPDATE 表名 SET 1 = 1, 2 = 2, ... WHERE 条件; 注意:在更新表记录时要小心!请注意UPDATE语句中WHERE子句。

43120

SQL优化

一、SQL语句编写注意问题 下面就某些SQL语句where子句编写需要注意问题作详细介绍。...联接 对于有联接,即使最后联接为一个静态,优化器是不会使用索引。...下面是一个采用联接查询SQL语句,这条语句完全可以查询出是否有Bill Cliton这个员工,但是这里需要注意,系统优化器对基于last_name创建索引没有使用。...Order by语句 ORDER BY语句决定了Oracle如何将返回查询结果排序。Order by语句对要排序没有什么特别的限制,也可以将函数加入列(象联接或者附加等)。...任何在Order by语句非索引项或者有计算表达式都将降低查询速度 2、应尽量避免在 where 子句中对字段进行 null 判断,否则将导致引擎放弃使用索引而进行全表扫描,select id from

4.8K20

使用tp框架和SQL语句查询数据表某字段包含某

有时我们需要查询某个字段是否包含某时,通常用like进行模糊查询,但对于一些要求比较准确查询时(例如:微信公众号关键字回复匹配查询)就需要用到MySQL find_in_set()函数; 以下是用...find_in_set()函数写sq查询l语句示例: $keyword = '你好'; $sql = "select * from table_name where find_in_set('"....$keyword"',msg_keyword) and msg_active = 1"; 以下是在tp框架中使用find_in_set()函数查询示例: $keyword = '你好'; $where...数据库关键字要以英文“,”分隔; 2.存储数据要对分隔符进行处理,保证以英文“,”分隔关键字。...以上这篇使用tp框架和SQL语句查询数据表某字段包含某就是小编分享给大家全部内容了,希望能给大家一个参考。

7.3K31

这是我见过最有用Mysql面试题,面试了无数公司总结(内附答案)

RDBMS是基于关系模型数据库管理系统(DBMS)。 可以使用结构化查询语言(SQL)访问关系数据库数据 10.在IT行业中流行数据库管理系统是什么?...子查询是另一个查询SQL查询。它是Select语句子集, 其返回用于过滤主查询条件。 25.子查询类型是什么?...SQL可用约束有哪些? SQL一些约束包括–主键,外键,唯一键,SQL非空,默认,检查和索引约束。 38.什么是唯一约束? 使用唯一约束来确保字段/没有重复。 39.什么是主键?...Where子句不能与Aggregate函数一起使用,但是Haveing子句可以。 68. SQL聚合函数是什么? SQL聚合函数返回单个,该是根据计算得出。...这三个功能以相同方式工作。这些函数用于将NULL替换为另一个。Oracle开发人员使用NVL函数,MySQL开发人员使用IFNULL函数,而SQL Server开发人员使用ISNULL函数。

27K20

编写高性能SQL

IS NULL 与 IS NOT NULL    不能用null作索引,任何包含null都将不会被包含在索引。即使索引有多这样之情况下,只要这些中有一含有null,该就会从索引中排除。...也就是说如果某存在空,即使对该建索引也不会提高性能。    任何在where子句中使用is null或is not null语句优化器是不允许使用索引。 ...联接    对于有联接,即使最后联接为一个静态,优化器是不会使用索引。...下面是一个采用联接查询SQL语句, 上面这条语句完全可以查询出是否有Bill Cliton这个员工,但是这里需要注意,系统优化器对基于last_name创建索引没有使用。   ...第二种查询允许Oracle对salary使用索引,而第一种查询则不能使用索引。  6. IN和EXISTS    有时候会将一和一系列相比较。最简单办法就是在where子句中使用子查询。

2.3K20

SQL高级查询方法

在 Transact-SQL ,包含子查询语句和语义上等效不包含子查询语句(即联接方式)在性能上通常没有差别。但是,在一些必须检查存在性情况使用联接会产生更好性能。...联接条件可通过以下方式定义两个表在查询关联方式: 指定每个表要用于联接。典型联接条件在一个表中指定一个外键,而在另一个表中指定与其关联键。...左向外部联接结果集包括 LEFT OUTER 子句中指定左表所有行,而不仅仅是联接所匹配行。如果左表某一行在右表没有匹配行,则在关联结果集行,来自右表所有选择列表列均为空。...FULL JOIN 或 FULL OUTER JOIN 完整外部联接将返回左表和右表所有行。当某一行在另一个没有匹配行时,另一个选择列表列将包含空。...使用 UNION 运算符时需遵循下列准则: 在用 UNION 运算符组合语句中,所有选择列表表达式(列名称、算术表达式、聚合函数等)数目必须相同。

5.7K20

SQL 性能调优

回到顶部 (15) 用EXISTS替代IN、用NOT EXISTS替代NOT IN 在许多基于基础表查询,为了满足一个条件,往往需要对另一个表进行联接.在这种情况下, 使用EXISTS(或NOT EXISTS...如果至少有一个不为空,则记录存在于索引.举例: 如果唯一性索引建立在表A和B列上, 并且表存在一条记录A,B为(123,null) , ORACLE将不接受下一条具有相同A,B(123,...因为空不存在于索引,所以WHERE子句中对索引进行空比较将使ORACLE停用该索引....任何在where子句中使用is null或is not null语句优化器是不允许使用索引。 回到顶部 (37) 联接 对于有联接,即使最后联接为一个静态,优化器是不会使用索引。...Order by语句对要排序没有什么特别的限制,也可以将函数加入列(象联接或者附加等)。任何在Order by语句非索引项或者有计算表达式都将降低查询速度。

3.2K10

数据库性能优化之SQL语句优化

也就是说如果某存在空,即使对该建索引也不会提高性能。任何在where子句中使用is null或is not null语句优化器是不允许使用索引。...推荐方案:用其它相同功能操作运算代替,:a is not null 改为 a>0 或a>’’等。不允许字段为空,而用一个缺省代替空申请状态字段不允许为空,缺省为申请。...select * from gc_dfys union all select * from ls_jg_dfys (g) 联接 对于有联接,即使最后联接为一个静态,优化器是不会使用索引...Order by语句对要排序没有什么特别的限制,也可以将函数加入列(象联接或者附加等)。任何在Order by语句非索引项或者有计算表达式都将降低查询速度。...(15) 用EXISTS替代IN、用NOT EXISTS替代NOT IN: 在许多基于基础表查询,为了满足一个条件,往往需要对另一个表进行联接.在这种情况下, 使用EXISTS(或NOT EXISTS

5.6K20

SQL 性能调优

(15) 用EXISTS替代IN、用NOT EXISTS替代NOT IN 在许多基于基础表查询,为了满足一个条件,往往需要对另一个表进行联接.在这种情况下, 使用EXISTS(或NOT...如果至少有一个不为空,则记录存在于索引.举例: 如果唯一性索引建立在表A和B列上, 并且表存在一条记录A,B为(123,null) , ORACLE将不接受下一条具有相同A,B(123,...因为空不存在于索引,所以WHERE子句中对索引进行空比较将使ORACLE停用该索引....任何在where子句中使用is null或is not null语句优化器是不允许使用索引。 (37) 联接 对于有联接,即使最后联接为一个静态,优化器是不会使用索引。...Order by语句对要排序没有什么特别的限制,也可以将函数加入列(象联接或者附加等)。任何在Order by语句非索引项或者有计算表达式都将降低查询速度。

2.7K60

【21】进大厂必须掌握面试题-65个SQL面试

SQL和MySQL有什么区别? SQL MySQL SQL是一种标准语言,代表基于英语结构化查询语言 MySQL是一个数据库管理系统。...交叉联接产生两个表叉积或笛卡尔积,而自然联接基于两个表具有相同名称和数据类型所有。 Q28。什么是SQL子查询? 子查询是另一个查询查询,其中定义了查询以从数据库检索数据或信息。...它不被视为独立查询,因为它引用另一个表并引用一个表。 不相关子查询:此查询是一个独立查询,在主查询替换了子查询输出。 Q30。列出获取表记录计数方法?...插入数据时如何在插入NULL? 可以通过以下方式插入NULL: 隐式地通过从列表中省略。 通过在VALUES子句中指定NULL关键字来显式 Q36。”...视图是一个虚拟表,由表包含数据子集组成。由于不存在视图,因此占用空间更少。视图可以合并一个或多个表数据,这取决于关系。 Q55。视图用途是什么? 视图是指基于表或另一个视图逻辑快照。

6.4K22

java面试(3)SQL优化

何在Order by语句非索引项或者有计算表达式都将降低查询速度 应尽量避免在 where 子句中对字段进行 null 判断,否则将导致引擎放弃使用索引而进行全表扫描,select id...任何在where子句中使用is null或is not null语句优化器是不允许使用索引。...order by子句:执行顺序从左到右 避免数据类型不一致 读取适当记录LIMIT M,N 避免在select子语句中使用子查询 对于有联接,即使最后联接为一个静态,优化器是不会使用索引...用EXISTS替代IN、用NOT EXISTS替代NOT IN: 在许多基于基础表查询,为了满足一个条件,往往需要对另一个表进行联接.在这种情况下, 使用EXISTS(或NOT EXISTS)通常将提高查询效率...另一个使用索引好处是,它提供了主键(primary key)唯一性验证.。那些LONG或LONG RAW数据类型, 你可以索引几乎所有的. 通常, 在大型表中使用索引特别有效.

3.2K20

【T-SQL基础】02.联接查询

当需要根据主键-外键关系来联接两个表而且主外键关系是组合(即关系基于多个)时,通常使用组合联接。...B表定义了一个外键(id1,id2),引用了D表id1,id2,现在要写一个主外键关系来联接两个表查询。...(2)外联接第三个逻辑查询处理步骤就是要识别保留表按照ON条件在另一个表找不到与之匹配那些行,再把这些行添加到联接前两个步骤生成结果表。...2.从逻辑上说,这两个客户相关数据行在联接第二步(基于ON谓词条件过滤)就被过滤了,而在第三部又把这些行作为外部行添加了进来。 3.如果使用联接,结果将不会返回这两行。...2.对于任何外联接(左外联接欸、右外联接、和全外联接),如果后面紧跟着一个内联接或右外联接,都会抵消外联接外部行。前提是,联接条件对来自联接左边NULL联接右边某些进行了比较。

2.9K90

数据库概念相关

答:索引象书目录类似,索引使数据库程序无需扫描整个表,就可以在其中找到所需要数据,索引包含了一个表包含列表,其中包含了各个行所存储位置,索引可以是单个或一组,索引提供数据逻辑位置...推荐方案:用其它相同功能操作运算代替,:a is not null 改为 a>0 或a>’’等。不允许字段为空,而用一个缺省代替空申请状态字段不允许为空,缺省为申请。...内部联接(inner join)一个联接,返回两表公共都匹配行 外部联接(outer join) 一个联接,该联接还包括那些和联接记录不相关记录。...u 左外部联接(left outer join)   左边表是主表,所有;右表无取null u 右外部联接(right outer join)  右边表是主表,所有;左边表只匹配行,没有置...null u 完全外部联接 所有,没有置null 15.

1.6K110

浅谈数据库Join实现原理

一.Nested Loopsb Join 1.定义 Nested Loops也称为嵌套迭代,它将一个联接输入用作外部输入表(显示为图形执行计划顶端输入),将另一个联接输入用作内部(底端)输入表。...将基于所执行逻辑操作返回所有满足 Argument (可选)谓词行。 二.Merge Join 1.定义 Merge Join第一个步骤是确保两个关联表都是按照关联字段进行排序。...如果不需要显式排序(例如,如果数据库内有合适 B 树索引或可以对多个操作(合并联接和对汇总分组)使用排序顺序),则合并联接尤其有效。...Probe(探测)阶段,SQL Server从probe input输入取出每一行记录,同样将该行记录关联字段使用build阶段相同hash函数生成hash,根据这个hash,从build...HASH:()谓词以及一个用于创建哈希列表出现在Argument内。然后,该谓词为每个探测行(如果适用)使用相同哈希函数计算哈希并在哈希表内查找匹配项。

5.2K100

SQL Server 2012学习笔记 (三) ----- SQL Server SQL语句

合并操作与联接相似,因为它们都是将两个表合并起来形成另一个方法。然而,它们合并方法有本质上不同,结果表形状如下所示。 注:A和B分别代表两个数据源表。 ?   ...BY子句分组小计 使用UNION合并查询结果集 8)使用聚合函数统计汇总 使用SUM()求使用AVG()求平均值 使用MAX()求最大 使用MIN()求最小 使用COUNT...某些特殊SQL指令不能和别的SQL语句共存在一个批处理CREATE TABLE和CREATE VIEW语句。这些语句只能独自存在于一个单独存储过程。   ...不能在定义一个CHECK约束之后,在同一个批处理中使用。   不能在修改表一个字段之后,立即在同一个批处理引用这个字段。   使用SET语句设置某些选项不能应用于同一个批处理查询。...7、规则、默认和完整性约束   规则是对存储数据表或用户定义数据类型约束,规则与其作用表或用户定义数据类型是相互独立,也就是说,对表或用户定义数据类型任何操作与对其设置规则不存在影响

6.4K20
领券