首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

盘点一个Pandas提取Excel列包含特定关键词的行(上篇)

一、前言 前几天在Python白银交流群【上海新年人】问了一个Pandas数据提取的问题,问题如下:大佬们,请教个小问题,我要查找某列中具体的值,譬如df[df['作者'] == 'abc'],但实际上这样子我找不到...ABC,因为对方实际是小写的abc。...给了一个指导,如下所示: 全部转大写或者小写你就不用考虑了 只是不确定你实际的代码场景。后来【论草莓如何成为冻干莓】给了一份代码,如下图所示: 顺利地解决了粉丝的问题。...但是粉丝的需求又发生了改变,下一篇文章我们一起来看看这个“善变”的粉丝提问。 三、总结 大家好,我是皮皮。...这篇文章主要盘点了一个Pandas数据提取的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

32210

盘点一个Pandas提取Excel列包含特定关键词的行(下篇)

他的代码照片如下图: 这个代码这么写,最后压根儿就没有得到他自己预期的结果,遂来求助。这里又回归到了他自己最开始的需求澄清!!!论需求表达清晰的重要性!...二、实现过程 后来【莫生气】给了一份代码,如下图所示: 本以为顺利地解决了问题,但是粉丝又马上增改需求了,如下图所示: 真的,代码写的,绝对没有他需求改的快。得亏他没去做产品经理,不然危矣!...能给你做出来,先实现就不错了,再想着优化的事呗。 后来【莫生气】给了一个正则表达式的写法,总算是贴合了这个粉丝的需求。 如果要结合pandas的话,可以写为下图的代码: 至此,粉丝不再修改需求。...这篇文章主要盘点了一个Pandas数据提取的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。 最后感谢粉丝【上海新年人】提出的问题,感谢【鶏啊鶏。】...、【论草莓如何成为冻干莓】、【冯诚】给出的思路,感谢【莫生气】等人参与学习交流。

32710
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    盘点一个Pandas提取Excel列包含特定关键词的行(中篇)

    一、前言 前几天在Python白银交流群【上海新年人】问了一个Pandas数据提取的问题,但是粉丝又改需求了,需求改来改去的,就是没个定数。 这里他的最新需求,如上图所示。...他的意思在这里就是要上图中最下面这3个。 二、实现过程 后来【论草莓如何成为冻干莓】给了一份代码,如下图所示: 顺利地解决了粉丝的问题。...可以看到,代码刚给出来,但是粉丝的需求又发生了改变,不过不慌,这里又给出了对应代码,如下图所示: 一看就会,一用就废,粉丝自己刚上手,套用到自己的数据里边,代码就失灵了。...下一篇文章,我们再来看这位粉丝新遇到的问题。 三、总结 大家好,我是皮皮。这篇文章主要盘点了一个Pandas数据提取的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。...最后感谢粉丝【上海新年人】提出的问题,感谢【鶏啊鶏。】、【论草莓如何成为冻干莓】给出的思路,感谢【莫生气】等人参与学习交流。

    21610

    SQL中的行转列和列转行

    而在SQL面试中,一道出镜频率很高的题目就是行转列和列转行的问题,可以说这也是一道经典的SQL题目,本文就这一问题做以介绍分享。 ? 给定如下模拟数据集,这也是SQL领域经典的学生成绩表问题。...由多行变一行,那么直觉想到的就是要groupby聚合;由一列变多列,那么就涉及到衍生提取; 既然要用groupby聚合,那么就涉及到将多门课的成绩汇总,但现在需要的不是所有成绩汇总,而仍然是各门课的独立成绩...其中,if(course='语文', score, NULL)语句实现了当且仅当课程为语文时取值为课程成绩,否则取值为空,这相当于衍生了一个新的列字段,且对于每个uid而言,其所有成绩就只有特定课程的结果非空...02 列转行:union 列转行是上述过程的逆过程,所以其思路也比较直观: 行记录由一行变为多行,列字段由多列变为单列; 一行变多行需要复制,列字段由多列变单列相当于是堆积的过程,其实也可以看做是复制;...一行变多行,那么复制的最直观实现当然是使用union,即分别针对每门课程提取一张衍生表,最后将所有课程的衍生表union到一起即可,其中需要注意字段的对齐 按照这一思路,给出SQL实现如下: SELECT

    7.2K30

    SQL 中的行转列和列转行

    行转列,列转行是我们在开发过程中经常碰到的问题。行转列一般通过CASE WHEN 语句来实现,也可以通过 SQL SERVER 的运算符PIVOT来实现。用传统的方法,比较好理解。...但是PIVOT 、UNPIVOT提供的语法比一系列复杂的SELECT…CASE 语句中所指定的语法更简单、更具可读性。下面我们通过几个简单的例子来介绍一下列转行、行转列问题。...[StudentScores] GROUP BY UserName 复制代码 查询结果如图所示,这样我们就能很清楚的了解每位学生所有的成绩了 接下来我们来看看第二个小列子。...这也是一个典型的行转列的例子。...这个是因为:对升级到 SQL Server 2005 或更高版本的数据库使用 PIVOT 和 UNPIVOT 时,必须将数据库的兼容级别设置为 90 或更高。

    5.5K20

    列存储、行存储之间的关系和比较

    尽管这种方式很明显的不太适合于交易环境,在交易环境中,一个事务与一行数据有效对应,而在查询进程环境中,很显然,查询是基于特定的列来选择的。...列存储法是将数据按照列存储到数据库中,与行存储类似; 3.1基于行的储存 基于行的存储是将数据组织成多个行,这样就能在一个操作中找到所有的列。...这表示对某个列中特定值的搜索可以直接进入该列的存储区,而不需要扫描整行的数据。这样也使得数据压缩变得更容易,因为一个列中的数据通常具有相同的数据类型。...算法的 6~23 行处理J 空间的最左叶子节点: (1) T1 处理的结果包含A 列, 可确定J 与T1空间的串行连接方式。T2 包含B 列时, 可确定A、B 并行, J 与T2 串行。...T2 不包含B 列时, 根据代价的权衡来决定连接方式。(2) T1 处理的结果不包含A 列, 可根据代价估计A 列与T1 列的串并行I/O, 选择产生较小I/O的策略。接下来处理同(1)。

    6.7K10

    select count(*)、count(1)、count(主键列)和count(包含空值的列)有何区别?

    下班路上看见网上有人问一个问题: oracle 10g以后count(*)和count(非空列)性能方面有什么区别?...首先,准备测试数据,11g库表bisal的id1列是主键(确保id1列为非空),id2列包含空值, ?...前三个均为表数据总量,第四个SQL结果是99999,仅包含非空记录数据量,说明若使用count(允许空值的列),则统计的是非空记录的总数,空值记录不会统计,这可能和业务上的用意不同。...其实这无论id2是否包含空值,使用count(id2)均会使用全表扫描,因此即使语义上使用count(id2)和前三个SQL一致,这种执行计划的效率也是最低的,这张测试表的字段设置和数据量不很夸张,因此不很明显...总结: 11g下,通过实验结论,说明了count()、count(1)和count(主键索引字段)其实都是执行的count(),而且会选择索引的FFS扫描方式,count(包含空值的列)这种方式一方面会使用全表扫描

    3.4K30

    Pandas库的基础使用系列---获取行和列

    前言我们上篇文章简单的介绍了如何获取行和列的数据,今天我们一起来看看两个如何结合起来用。获取指定行和指定列的数据我们依然使用之前的数据。...我们先看看如何通过切片的方法获取指定列的所有行的数据info = df.loc[:, ["2021年", "2017年"]]我们注意到,行的位置我们使用类似python中的切片语法。...我们试试看如何将最后一列也包含进来。info = df.iloc[:, [1, 4, -1]]可以看到也获取到了,但是值得注意的是,如果我们使用了-1,那么就不能用loc而是要用iloc。...大家还记得它们的区别吗?可以看看上一篇文章的内容。同样我们可以利用切片方法获取类似前4列这样的数据df.iloc[:, :4]由于我们没有指定行名称,所有指标这一列也计算在内了。...通常是建议这样获取的,因为从代码的可读性上更容易知道我们获取的是哪一行哪一列。当然我们也可以通过索引和切片的方式获取,只是可读性上没有这么好。

    63700

    传统的行存储和(HBase)列存储的区别「建议收藏」

    1 为什么要按列存储 列式存储(Columnar or column-based)是相对于传统关系型数据库的行式存储(Row-basedstorage)来说的。...所以它们就有了如下这些优缺点: 行式存储 列式存储 优点 Ø 数据被保存在一起 Ø INSERT/UPDATE容易 Ø 查询时只有涉及到的列会被读取 Ø 投影(projection)很高效...Ø 任何列都能作为索引 缺点 Ø 选择(Selection)时即使只涉及某几列,所有数据也都会被读取 Ø 选择完成时,被选择的列要重新组装 Ø INSERT/UPDATE比较麻烦 注:...正因为每个字符串在字典表里只出现一次了,所以达到了压缩的目的(有点像规范化和非规范化Normalize和Denomalize) 3查询执行性能 下面就是最牛的图了,通过一条查询的执行过程说明列式存储...用数字去列表里匹配,匹配上的位置设为1。 3. 把不同列的匹配结果进行位运算得到符合所有条件的记录下标。 4. 使用这个下标组装出最终的结果集。

    1.4K20

    Pandas针对某列的百分数取最大值无效?(下篇)

    一、前言 前几天在Python白银交流群【上海新年人】问了一个Pandas数据提取的问题,问题如下:大佬们,我发现个问题,请教一下,我把某一列譬如0.001什么的,转化了1%以后再对某列做print(df...[df.点击 == df['点击'].max()],最大值 明明有15%的却显示不出来,只显示出来10%以下的,是什么原因啊?...上一篇文章中【瑜亮老师】先取最大值所在的行,然后在转换格式展示数据。这个思路顺利地解决了粉丝的问题,这一篇文章我们一起来看看另外的一个解决思路。那如果这excel中已经有百分数了,怎么取最大数?...二、实现过程 后来【论草莓如何成为冻干莓】给了一个提示如下:一般来说在Excel可以设置格式为百分数,而不是添加字符串%符号,如果是后者,把字符串型的百分数转换成小数,再取最大值 这里【瑜亮老师】给了一个代码如下...这篇文章主要盘点了一个Pandas数据提取的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

    17610

    Pandas针对某列的百分数取最大值无效?(上篇)

    一、前言 前几天在Python白银交流群【上海新年人】问了一个Pandas数据提取的问题,问题如下:大佬们,我发现个问题,请教一下,我把某一列譬如0.001什么的,转化了1%以后,再对某列做print(...df[df.点击 == df['点击'].max()],最大值 明明有15%的却显示不出来,只显示出来10%以下的,是什么原因啊?...二、实现过程 后来【瑜亮老师】也给了一个提示如下:因为你的百分比这一列是文本格式的。首先的话需要进行数据类型转换,现在先转为flaot型的。...df[df.比例 == df.比例.max()] max1['比例'] = max1['比例'].apply(lambda x: '{:.2%}'.format(x)) print(max1) 先取最大值所在的行...这篇文章主要盘点了一个Pandas数据提取的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

    12110

    盘点使用Pandas解决问题:对比两列数据取最大值的5个方法

    一、前言 前几天在Python星耀交流群有个叫【iLost】的粉丝问了一个关于使用pandas解决两列数据对比的问题,这里拿出来给大家分享下,一起学习。...大概意思是说在DF中有2列数据,想每行取两列数据中的最大值,形成一个新列,该怎么写?最开始【iLost】自己使用了循环的方法写出了代码,当然是可行的,但是写的就比较难受了。...二、解决过程 这里给出5个方法,感谢大佬们的解答,一起来看看吧! 方法一:【月神】解答 其实这个题目的逻辑和思路也相对简单,但是对于Pandas不熟悉的小伙伴,接受起来就有点难了。...亲测可行,代码如下: df = df.assign(new=df[['cell1', 'cell2']].max(1)) 这里的用法需要注意下,不然容易翻车: 细节拉满: 方法五:【上海-数分-...这篇文章基于粉丝提问,针对df中,想在每行取两列数据中的最大值,作为新的一列问题,给出了具体说明和演示,一共5个方法,顺利地帮助粉丝解决了问题,也帮助大家玩转Pandas,学习Python相关知识。

    4.3K30

    重温SQL Server的行转列和列转行,面试常考题

    行转列,列转行是我们在开发过程中经常碰到的问题。行转列一般通过CASE WHEN 语句来实现,也可以通过 SQL SERVER 的运算符PIVOT来实现。用传统的方法,比较好理解。...但是PIVOT 、UNPIVOT提供的语法比一系列复杂的SELECT…CASE 语句中所指定的语法更简单、更具可读性。下面我们通过几个简单的例子来介绍一下列转行、行转列问题。...[StudentScores] GROUP BY UserName 查询结果如图所示,这样我们就能很清楚的了解每位学生所有的成绩了 接下来我们来看看第二个小列子。...这也是一个典型的行转列的例子。...这个是因为:对升级到 SQL Server 2005 或更高版本的数据库使用 PIVOT 和 UNPIVOT 时,必须将数据库的兼容级别设置为 90 或更高。

    72310

    MySQL中的行转列和列转行操作,附SQL实战

    本文将详细介绍MySQL中的行转列和列转行操作,并提供相应的SQL语句进行操作。行转列行转列操作指的是将表格中一行数据转换为多列数据的操作。在MySQL中,可以通过以下两种方式进行行转列操作。1....例如,假设我们有一个订单表,包含订单编号、订单日期和订单金额等字段。...如果想要将所有不同日期的订单金额作为列进行展示,可以使用如下SQL语句:SELECT order_id, [2010], [2011], [2012], [2013], [2014]FROM...结论MySQL中的行转列和列转行操作都具有广泛的应用场景,能够满足各种分析和报表需求。在实际应用中,可以根据具体的需求选择相应的MySQL函数或编写自定义SQL语句进行操作。...需要注意的是,在进行行转列和列转行操作时,要考虑到数据的准确性和可读性,避免数据丢失和混淆。

    18K20
    领券