首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

问与答112:如何查找一列中的内容是否在另一列中并将找到的字符添加颜色?

Q:我在列D的单元格中存放着一些数据,每个单元格中的多个数据使用换行分开,列E是对列D中数据的相应描述,我需要在列E的单元格中查找是否存在列D中的数据,并将找到的数据标上颜色,如下图1所示。 ?...A:实现上图1中所示效果的VBA代码如下: Sub ColorText() Dim ws As Worksheet Dim rDiseases As Range Dim rCell...End If Loop Next iDisease Next rCell End Sub 代码中使用Split函数以回车符来拆分单元格中的数据并存放到数组中...,然后遍历该数组,在列E对应的单元格中使用InStr函数来查找是否出现了该数组中的值,如果出现则对该值添加颜色。...Bug:通常是交替添加红色和绿色,但是当句子中存在多个匹配或者局部匹配时,颜色会打乱。

7.2K30

【Python】基于某些列删除数据框中的重复值

导入数据处理的库 os.chdir('F:/微信公众号/Python/26.基于多列组合删除数据框中的重复值') #把路径改为数据存放的路径 name = pd.read_csv('name.csv...从结果知,参数为默认值时,是在原数据的copy上删除数据,保留重复数据第一条并返回新数据框。 感兴趣的可以打印name数据框,删重操作不影响name的值。...四、按照多列去重 对多列去重和一列去重类似,只是原来根据一列是否重复删重。现在要根据指定的列判断是否存在重复(顺序也要一致才算重复)删重。...原始数据中只有第二行和最后一行存在重复,默认保留第一条,故删除最后一条得到新数据框。 想要根据更多列数去重,可以在subset中添加列。...但是对于两列中元素顺序相反的数据框去重,drop_duplicates函数无能为力。 如需处理这种类型的数据去重问题,参见本公众号中的文章【Python】基于多列组合删除数据框中的重复值。 -end-

20.5K31
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    【Python】基于多列组合删除数据框中的重复值

    最近公司在做关联图谱的项目,想挖掘团伙犯罪。在准备关系数据时需要根据两列组合删除数据框中的重复值,两列中元素的顺序可能是相反的。...Python中有多种方法可以处理这类问题。一种是写循环依次判断是否重复删重,另一种是用本公众号文章:Python中的集合提到的frozenset函数,一句语句解决该问题。 循环太过繁琐,而且速度较慢。...本文介绍一句语句解决多列组合删除数据框中重复值的问题。 一、举一个小例子 在Python中有一个包含3列的数据框,希望根据列name1和name2组合(在两行中顺序不一样)消除重复项。...由于原始数据是从hive sql中跑出来,表示商户号之间关系的数据,merchant_r和merchant_l中存在组合重复的现象。现希望根据这两列组合消除重复项。...从上图可以看出用set替换frozense会报不可哈希的错误。 三、把代码推广到多列 解决多列组合删除数据框中重复值的问题,只要把代码中取两列的代码变成多列即可。

    14.7K30

    大佬们,如何把某一列中包含某个值的所在行给删除

    一、前言 前几天在Python白银交流群【上海新年人】问了一个Pandas数据处理的问题,一起来看看吧。 大佬们,如何把某一列中包含某个值的所在行给删除?比方说把包含电力这两个字的行给删除。...二、实现过程 这里【莫生气】给了一个思路和代码: # 删除Column1中包含'cherry'的行 df = df[~df['Column1'].str.contains('电力')] 经过点拨,顺利地解决了粉丝的问题...后来粉丝增加了难度,问题如下:但如果我同时要想删除包含电力与电梯,这两个关键的,又该怎么办呢? 这里【莫生气】和【FANG.J】继续给出了答案,可以看看上面的这个写法,中间加个&符号即可。...顺利地解决了粉丝的问题。 但是粉丝还有其他更加复杂的需求,其实本质上方法就是上面提及的,如果你想要更多的话,可以考虑下从逻辑 方面进行优化,如果没有的话,正向解决,那就是代码的堆积。...这篇文章主要盘点了一个Pandas数据处理的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

    18810

    Pandas数据分析

    last') # drop_duplicate方法的keep参数用于指定在删除重复行时保留哪个重复项 # 'first'(默认):保留第一个出现的重复项,删除后续重复项。...# 'last':保留最后一个出现的重复项,删除之前重复项。...# False:删除所有重复项 数据连接(concatenation) 连接是指把某行或某列追加到数据中 数据被分成了多份可以使用连接把数据拼接起来 把计算的结果追加到现有数据集,可以使用连接 import...,与添加行的方法类似,需要多传一个axis参数 axis的默认值是index 按行添加 向DataFrame添加一列,不需要调用函数,通过dataframe['列名'] = ['值'] 即可 通过dataframe...的列或行索引和另一个DataFrame的列或行索引 默认是内连接(也可以设为左连接、外连接、右连接)

    11910

    MySQL数据库学习

    列名n 数据类型n ); 注意 最后一列,不需要加逗号(,)。...如果表名后,不定义列名,则默认给所有列添加值。 insert into 表名 values(值1,值2,…值n); 除了数字类型,其他类型需要使用引号(单双都可以)引起来。...,某一列的值不能重复 唯一约束可以有 NULL 值,但是只能有一条记录为 NULL....但是如果多个事务操作同一批数据,则会引发一些问题,设置不同的隔离级别就可以解决这些问题。 问题 脏读:一个事务,读取到另一个事务中没有提交的数据。...不可重复读(虚读):在同一个事务中,两次读取到的数据不一样。 幻读:一个事务操作 (DML) 数据表中所有记录,另一个事务添加了一条数据,则第一个事务查询不到自己的修改。

    4.2K20

    Power Query 真经 - 第 10 章 - 横向合并数据

    当 Power Query 出现后,用户可以不用学习 SQL 连接、Excel 复杂公式或者学习如何建立关系型数据库结构,就可以使用另一种轻松的方式将两个表合并在一起。...【注意】 Power Query 还支持一对一和多对多的连接。 在本例中,“SKU” 列在 “Inventory” 表中包含唯一值,而在 “Sales” 表中有重复记录,使用这一列连接两边。...【注意】 每次创建正确的【右反】连接时,连接的结果将显示一行空值,并在最后一列中显示一个嵌套表。这是意料之中的,因为左表中没有匹配项,导致每列的值为空。...在这种情况下,解决这个问题的方法非常简单:在 “Months” 表中,右击 “Month” 列并选择【删除重复项】。这样做应该是安全的,因为不应该两次预测同一个月。...但是,在【合并】之前【删除重复项】也应谨慎。

    4.4K20

    这是我见过最有用的Mysql面试题,面试了无数公司总结的(内附答案)

    NOT NULL约束用于确保字段中的值不能为NULL 49.什么是CHECK约束? CHECK约束用于限制一列或多列接受的值。 例如,“年龄”字段应仅包含大于18的值。...在SQL Server中,数据库表中的每一列都有一个名称和一种数据类型。 在创建SQL表时,我们需要决定在表的每一列中存储哪种数据类型。 57.可以在BOOLEAN数据字段中存储哪些可能的值?...这是棘手的SQL面试问题之一。采访者可能以另一种方式问您这个问题,因为“全联盟”优于“全联盟”有什么优势。...全部合并: 返回不同选择语句结果集中的所有行,包括重复项。 在性能方面,Union All比Union更快,因为Union All不会删除重复项。联合查询检查重复值,这会花费一些时间来删除重复记录。...它验证架构,数据库表,列,索引,存储过程,触发器,数据重复,孤立记录,垃圾记录。它涉及更新数据库中的记录并在前端进行验证。

    27.1K20

    超详细的MySQL三万字总结

    删除表 修改表结构 DML 操作表中的数据 插入记录 蠕虫复制 什么是蠕虫复制 更新表记录 删除表记录 DQL 查询表中的数据 简单查询 指定列的别名进行查询 清除重复值 查询结果参与运算 条件查询...五个聚合函数: SQL 中的聚合函数 作用 max(列名) 求这一列的最大值 min(列名) 求这一列的最小值 avg(列名) 求这一列的平均值 count(列名) 统计这一列有多少条记录 sum(列名...: 约束名 关键字 说明 主键 primary key 1、唯一 2、非空 默认 default 如果一列没有值,使用默认值 非空 not null 这一列必须有值 唯一 unique 这一列不能有重复值...1NF 概念: 数据库表的每一列都是不可分割的原子数据项,不能是集合、数组等非原子数据项。即表中的某个列有多个值时,必须拆分为不同的列。简而言之,第一范式每一列不可再拆分,称为原子性。...学生课程表: 存在的问题: 1.存在非常严重的数据冗余(重复):姓名、系名、系主任 2.数据添加存在问题:添加新开设的系和系主任时,数据不合法 3.数据删除存在问题:张无忌同学毕业了,删除数据

    3.4K30

    编写高效SQL的三个基础原则

    使用规范化数据意味着您将花费更少的时间来处理数据质量问题,例如查找和删除重复行 。这使您可以腾出更多时间来执行更有效率的任务,例如构建新功能。 规范化过程定义了一系列范式。...前三种范式是: 第一范式 (1NF): 每一行和每一列都存储单个值,并且没有重复的行。第二范式 (2NF): 没有依赖于主键或唯一键一部分的列。...更改这三列中的任何一列都意味着您还必须更改至少另外两列中的一列。通过从答案表中删除其中一列来避免这种不一致性。 请注意,更新测试存在一个例外。...唯一约束: 与主键类似,唯一约束阻止您存储重复值。与主键不同,您可以在唯一列中存储空值,并且一个表可以有多个唯一约束。外键: 定义父子关系。外键指向子表中的列到父表中的主键或唯一约束。...在讨论规范化时,我们看到了如何存储测验答案的开始时间、结束时间和持续时间会导致不一致。虽然删除其中一列是最佳解决方案,但这在长期运行的应用程序中可能不切实际。

    6500

    编写高效SQL的三个基础原则

    使用规范化数据意味着您将花费更少的时间来处理数据质量问题,例如查找和删除重复行 。这使您可以腾出更多时间来执行更有效率的任务,例如构建新功能。 规范化过程定义了一系列范式。...前三种范式是: 第一范式 (1NF): 每一行和每一列都存储单个值,并且没有重复的行。第二范式 (2NF): 没有依赖于主键或唯一键一部分的列。...更改这三列中的任何一列都意味着您还必须更改至少另外两列中的一列。通过从答案表中删除其中一列来避免这种不一致性。 请注意,更新测试存在一个例外。...唯一约束: 与主键类似,唯一约束阻止您存储重复值。与主键不同,您可以在唯一列中存储空值,并且一个表可以有多个唯一约束。外键: 定义父子关系。外键指向子表中的列到父表中的主键或唯一约束。...在讨论规范化时,我们看到了如何存储测验答案的开始时间、结束时间和持续时间会导致不一致。虽然删除其中一列是最佳解决方案,但这在长期运行的应用程序中可能不切实际。

    8410

    数据库的范式和备份

    数据库的设计 表的关系 一对一 : 在任意一方添加外键指向另一方的主键 注意:这个外键必须添加唯一约束(unique)不唯一的话就有可能成了多对一了 一对多(多对一):在多的一方建立外键,指向一的一方的主键...所谓第一范式(1NF)是指数据库表的每一列都是不可分割的基本数据项,同一列中不能有多个值,即实体中的某个属性不能有多个值或者不能有重复的属性。...分析如下表格: 编码标题购买销售说明价格数量价格数量 * 其中购买列和销售列不满住第一范式的要求,购买列和销售列还可以细分为购买价格、购买数量、销售价格、销售数量这四列,所以不满住第一范式中每一列都是不可分割的基本数据项这一要求...第二范式(2NF)要求数据库表中的每个实例或行必须可以被唯一地区分。为实现区分通常需要为表加上一个列,以存储各个实例的唯一标识。这个唯一属性列被称为主关键字或主键、主码。...source 文件路径 navicat中: 新建数据库 右击 —> 运行SQL文件 找到SQL文件,打开后,开始执行。

    80210

    mysql小结(1) MYSQL索引特性小结

    这些问题可以通过分区分表或者缓存解决 6.选择率低的列不适合建立索引。如果索引项对应cardinality较小,例如小于10,那么使用索引时就需要考虑是否有必要。...需要通过添加索引,及减小事务粒度或者降低mysql默认隔离级别方式解决此类问题。...,匹配后一列..../O,提高速度,所以当分页没有特别指定的列时,指定主键排序即可,另外不需要在联合索引最后一列添加主键,因为它本身包含主键 【非聚簇索引不存储完整记录,通过访问主键索引找到完整记录 】。...但是需要考虑hash函数 的“碰撞”问题,选择适合的hash函数。 3.使用explain命令查看sql 的执行计划,请参考延伸阅读。

    1.1K30

    MySQL安装

    这是因为新的列被添加到表中时,默认排在最后一列。因此,即使 i 列原来是 mytbl 的第一列,但现在它是最后一列。...创建简单的索引只是省略UNIQUE关键字。简单的索引可以在表中重复的值。 如果想索引的列的值按降序排列,可以列名之后添加保留字DESC。...有时,需要识别重复记录并从表中删除它们。本章将介绍如何防止在一个表中,以及如何删除已有的重复记录。....在一般情况下,识别的集合值重复,执行以下步骤: 确定哪些列包含可重复值 列出这些列中的列选择列表,使用COUNT(*) 列出的列也可以使用 GROUP BY 子句 添加一个HAVING...在下面的例子中,用户名被限制在字母+数字+字符加下划线,并在8-20个字符之间的长度 - 可以根据需要修改这些规则。

    11.3K71

    SQL数据分析:从基础入门到进阶,提升SQL能力

    RDBMS 中的数据存储在被称为表(tables)的数据库对象中。表 是相关的数据项的集合,它由列和行组成。 由于本文主要讲解 SQL 基础,因此对数据库不做过多解释,只需要大概了解即可。...如需从 “LASTNAME” 列中仅选取唯一不同的值,我们需要使用 SELECT DISTINCT 语句: SELECT DISTINCT LASTNAME FROM Persons; 通过上述查询...,结果集中只显示了一列 Wilson,显然已经去除了重复列。...WHERE – 条件过滤 如果需要从表中选取指定的数据,可将 WHERE 子句添加到 SELECT 语句。...如果第一列中有些值为 null 时,情况也是这样的。 UPDATE – 更新数据 Update 语句用于修改表中的数据。

    3.3K42

    基于Excel2013的PowerQuery入门

    成功转换.png 其他的各项步骤原理相同,省略。 5.删除重复项 在下载文件中打开05-删除重复项.xlsx,如下图所示。 ? 删除重复项1.png ?...加载数据到PowerQuery中.png 客户首次购买分析 选定下单日期这一列,进行升序排序。 ? 下单日期升序排序.png 选定客户名称这一列,进行删除重复项 ?...对客户名称删除重复项.png ? 首次购买分析结果.png 客户最大订单分析 选定金额这一列,进行降序排序 ? 金额降序排序.png 选定客户名称这一列,进行删除重复项 ?...客户最大订单分析结果.png 多次购买客户分析 选定客户名称这一列,进行保留重复项 ? 保留重复项按钮位置.png 只有1次购买记录的客户会被删除,多次购买记录的客户会被保留。...例如一个客户有3次购买记录,保留重复项后该客户被保留3次购买记录。 ? 保留结果.png 6.删除错误 打开下载文件中的06-删除错误.xlsx,如下图所示。 ? 打开文件图示.png ?

    10.2K50

    两万字图文 SQL 零基础入门,不怕你学不会,就怕你不收藏!❤️

    RDBMS 中的数据存储在被称为表(tables)的数据库对象中。表 是相关的数据项的集合,它由列和行组成。 由于本文主要讲解 SQL 基础,因此对数据库不做过多解释,只需要大概了解即可。...,结果集中只显示了一列 Wilson,显然已经去除了重复列。...注意: 在第一列中有相同的值时,第二列是以升序排列的。如果第一列中有些值为 null 时,情况也是这样的。 ???? UPDATE – 更新数据 Update 语句用于修改表中的数据。...MAX – 最大值 MAX 函数返回一列中的最大值。NULL 值不包括在计算中。...MIN – 最小值 MIN 函数返回一列中的最小值。NULL 值不包括在计算中。

    8.4K11

    【PostgreSQL 】PostgreSQL 12的8大改进,性能大幅度提升

    现在,通过更有效地利用空间,多列索引大小最多可减少40%,从而节省了磁盘空间。具有重复项(非唯一B树索引)的索引的性能得以提高,并且从索引中删除元组(行)的真空运行效率更高。...此外,索引更新期间的锁定要求有所降低。 3.多列最有价值(MCV)统计信息 此更新已经进行了几年的开发,旨在解决多年来引起投诉的问题:查询中相关列的边缘情况。...以俄亥俄州辛辛那提为例-您有一个标记为“城市”的字段,另一字段称为“州”,其中“辛辛那提”位于一列,而俄亥俄州则在另一列。俄亥俄州的辛辛那提市将相当普遍,但亚利桑那州的辛辛那提市却很少见。...在此功能之前,PostgreSQL仅记录了多个列的单个相关值。从本质上讲,它将俄亥俄州的辛辛那提和亚利桑那州的辛辛那提视为同一件事。现在,您可以比较多个列并关联组合以优化查询索引。...4.公用表表达式(CTE) 正确实现的另一个过期功能是通用表表达式(带有查询内联)。公用表表达式充当优化障碍,公用表表达式中的查询首先执行,然后PostgreSQL将在查询中执行之后的任何操作。

    3.1K20
    领券