如何过滤DataFrame，使其在Pandas中的列中保留特定单词列表之后的行？

在Pandas中，可以使用str.contains()方法来过滤DataFrame，以保留列中包含特定单词列表的行。下面是一个完整的答案：

要过滤DataFrame，使其在Pandas中的列中保留特定单词列表之后的行，可以按照以下步骤进行操作：

导入必要的库：

import pandas as pd

创建一个示例DataFrame：

data = {'Name': ['John Doe', 'Jane Smith', 'Mike Johnson'],
        'Age': [25, 30, 35],
        'City': ['New York', 'London', 'Paris']}
df = pd.DataFrame(data)

定义一个包含特定单词列表的变量：

word_list = ['John', 'Paris']

使用str.contains()方法过滤DataFrame：

filtered_df = df[df['Name'].str.contains('|'.join(word_list))]

在上述代码中，df['Name'].str.contains('|'.join(word_list))会返回一个布尔Series，表示DataFrame中每行的Name列是否包含特定单词列表中的任何一个单词。然后，我们可以使用这个布尔Series来过滤DataFrame，只保留满足条件的行。

最后，filtered_df将是一个新的DataFrame，其中只包含Name列中包含特定单词列表的行。

这是一个简单的示例，你可以根据实际情况调整代码以适应你的数据和需求。

推荐的腾讯云相关产品：腾讯云数据库TDSQL、腾讯云云服务器CVM、腾讯云对象存储COS。

腾讯云产品介绍链接地址：

相关·内容

python中pandas库中DataFrame对行和列的操作使用方法示例

用pandas中的DataFrame时选取行或列： import numpy as np import pandas as pd from pandas import Sereis, DataFrame...6所在的行中的第4列，有点拗口 Out[31]: d three 13 data.ix[data.a 5,2:4] #选择'a'列中大于5所在的行中的第3-5（不包括5）列 Out[32]: c...d three 12 13 data.ix[data.a 5,[2,2,2]] #选择'a'列中大于5所在的行中的第2列并重复3次 Out[33]: c c c three 12 12 12 #还可以行数或列数跟行名列名混着用...(1) #返回DataFrame中的第一行最近处理数据时发现当pd.read_csv()数据时有时候会有读取到未命名的列，且该列也用不到，一般是索引列被换掉后导致的，有强迫症的看着难受，这时候dataframe.drop...github地址到此这篇关于python中pandas库中DataFrame对行和列的操作使用方法示例的文章就介绍到这了,更多相关pandas库DataFrame行列操作内容请搜索ZaLou.Cn以前的文章或继续浏览下面的相关文章希望大家以后多多支持

13.3K3 0

pandas中关于DataFrame行，列显示不完全（省略）的解决办法

大家好，又见面了，我是你们的朋友全栈君。有时候DataFrame中的行列数量太多，print打印出来会显示不完全。就像下图这样：列显示不全：行显示不全：添加如下代码，即可解决。...#显示所有列 pd.set_option('display.max_columns', None) #显示所有行 pd.set_option('display.max_rows', None) #设置value...的显示长度为100，默认为50 pd.set_option('max_colwidth',100) 根据自己的需要更改相应的设置即可。...ps：set_option()的所有属性： Available options: - display....display.max_categories : int This sets the maximum number of categories pandas should output when

8.6K2 0

通宵翻译Pandas官方文档，写了这份Excel万字肝货操作！

索引值也是持久的，所以如果你对 DataFrame 中的行重新排序，特定行的标签不会改变。 5. 副本与就地操作大多数 Pandas 操作返回 Series/DataFrame 的副本。...在 Pandas 中，您需要更多地考虑控制 DataFrame 的显示方式。默认情况下，pandas 会截断大型 DataFrame 的输出以显示第一行和最后一行。...在 Pandas 中，您通常希望在使用日期进行计算时将日期保留为日期时间对象。输出部分日期（例如年份）是通过电子表格中的日期函数和 Pandas 中的日期时间属性完成的。...按值排序 Excel电子表格中的排序，是通过排序对话框完成的。 pandas 有一个 DataFrame.sort_values() 方法，它需要一个列列表来排序。...提取第n个单词在 Excel 中，您可以使用文本到列向导来拆分文本和检索特定列。（请注意，也可以通过公式来做到这一点。）

19.5K2 0

5个例子学会Pandas中的字符串过滤

在本文中，我介绍将学习 5 种可用于过滤文本数据（即字符串）的不同方法：是否包含一系列字符求字符串的长度判断以特定的字符序列开始或结束判断字符为数字或字母数字查找特定字符序列的出现次数首先我们导入库和数据...import pandas as pd df = pd.read_csv("example.csv") df 我们这个样例的DataFrame 包含 6 行和 4 列。...我们将使用不同的方法来处理 DataFrame 中的行。第一个过滤操作是检查字符串是否包含特定的单词或字符序列，使用 contains 方法查找描述字段包含“used car”的行。...但是要获得pandas中的字符串需要通过 Pandas 的 str 访问器，代码如下： df[df["description"].str.contains("used car")] 但是为了在这个DataFrame...例如，在价格列中，有一些非数字字符，如 $ 和 k。我们可以使用 isnumeric 函数过滤掉。

2K2 0

数据分析之Pandas VS SQL！

SQL VS Pandas SELECT（数据选择）在SQL中，选择是使用逗号分隔的列列表(或*来选择所有列): ? 在Pandas中，选择不但可根据列名称选取，还可以根据列所在的位置选取。...相关语法如下： loc，基于列label，可选取特定行（根据行index） iloc，基于行/列的位置 ix，为loc与iloc的混合体，既支持label也支持position at，根据指定行index...WHERE（数据过滤）在SQL中，过滤是通过WHERE子句完成的： ? 在pandas中，Dataframe可以通过多种方式进行过滤，最直观的是使用布尔索引： ?...宝器带你画重点： subset，为选定的列做数据去重，默认为所有列； keep，可选择{'first', 'last', False}，保留重复元素中的第一个、最后一个，或全部删除； inplace ，...Pandas 中 inplace 参数在很多函数中都会有，它的作用是：是否在原对象基础上进行修改，默认为False，返回一个新的Dataframe；若为True,不创建新的对象，直接对原始对象进行修改。

3.1K2 0

整理了 25 个 Pandas 实用技巧，拿走不谢！

列序反转跟之前的技巧一样，你也可以使用loc函数将列从左至右反转： ? 逗号之前的冒号表示选择所有行，逗号之后的::-1表示反转所有的列，这就是为什么country这一列现在在最右边。 6....你可以对前两列使用astype()函数： ? 但是，如果你对第三列也使用这个函数，将会引起错误，这是因为这一列包含了破折号（用来表示0）但是pandas并不知道如何处理它。...如果你想要进行相反的过滤，也就是你将吧刚才的三种类型的电影排除掉，那么你可以在过滤条件前加上破浪号： ? 这种方法能够起作用是因为在Python中，波浪号表示“not”操作。 14....将一个由列表组成的Series扩展成DataFrame 让我们创建一个新的示例DataFrame: ? 这里有两列，第二列包含了Python中的由整数元素组成的列表。...你可以看到，每个订单的总价格在每一行中显示出来了。这样我们就能方便地甲酸每个订单的价格占该订单的总价格的百分比： ? 20. 选取行和列的切片让我们看一眼另一个数据集： ?

3.2K1 0

30 个小例子帮你快速掌握Pandas

我们删除了4列，因此列数从14减少到10。 2.读取时选择特定的列我们只打算读取csv文件中的某些列。读取时，列列表将传递给usecols参数。如果您事先知道列名，则比以后删除更好。...选择特定的列 3.读取DataFrame的一部分行 read_csv函数允许按行读取DataFrame的一部分。有两种选择。第一个是读取前n行。...重设索引，但原始索引保留为新列。我们可以在重置索引时将其删除。...method参数指定如何处理具有相同值的行。first表示根据它们在数组（即列）中的顺序对其进行排名。 21.列中唯一值的数量使用分类变量时，它很方便。我们可能需要检查唯一类别的数量。...29.根据字符串过滤我们可能需要根据文本数据（例如客户名称）过滤观察结果（行）。我已经将虚构名称添加到df_new DataFrame中。 ? 让我们选择客户名称以Mi开头的行。

10.6K1 0

手把手教你做一个“渣”数据师，用Python代替老情人Excel

5、略过行和列默认的read_excel参数假定第一行是列表名称，会自动合并为DataFrame中的列标签。...使用skiprows和header之类的函数，我们可以操纵导入的DataFrame的行为。 ? 6、导入特定列使用usecols参数，可以指定是否在DataFrame中导入特定的列。 ?...2、查看多列 ? 3、查看特定行这里使用的方法是loc函数，其中我们可以指定以冒号分隔的起始行和结束行。注意，索引从0开始而不是1。 ? 4、同时分割行和列 ? 5、在某一列中筛选 ?...7、用列表筛选多种数值 ? 8、筛选不在列表或Excel中的值 ? 9、用多个条件筛选多列数据输入应为列一个表，此方法相当于excel中的高级过滤器功能： ? 10、根据数字条件过滤 ?...11、在Excel中复制自定义的筛选器 ? 12、合并两个过滤器的计算结果 ? 13、包含Excel中的功能 ? 14、从DataFrame获取特定的值 ?

8.3K3 0

解决KeyError: “Passing list-likes to .loc or [] with any missing labels is no long

2781 0

Pandas 2.2 中文官方教程和指南（四）

索引值也是持久的，因此��果重新排列DataFrame中的行，特定行的标签不会改变。查看索引文档以了解如何有效使用Index。复制 vs....查看如何从现有列创建新列。过滤在 Excel 中，过滤是通过图形菜单完成的。数据框可以通过多种方式进行过滤；其中最直观的是使用布尔索引。...索引值也是持久的，因此如果重新排列DataFrame中的行，则特定行的标签不会更改。查看索引文档以了解如何有效地使用Index。...请参阅如何根据现有列创建新列。过滤在 Excel 中，过滤是通过一个图形菜单完成的。 DataFrame 可以以多种方式进行过滤；其中最直观的是使用布尔索引。...参见如何从现有列派生新列。过滤在 Excel 中，过滤是通过图形菜单完成的。 DataFrames 可以以多种方式进行过滤；其中最直观的是使用布尔索引。

1891 0

pandas分组聚合转换

，比如根据性别，如果现在需要根据多个维度进行分组，只需在groupby中传入相应列名构成的列表即可。...gb.agg(['sum', 'idxmax', 'skew']) # 对height和weight分别用三种方法聚合，所以共返回六列数据对特定的列使用特定的聚合函数可以通过构造字典传入agg中实现...47.918519 1 173.62549 72.759259 2 173.62549 72.759259 组索引与过滤过滤在分组中是对于组的过滤，而索引是对于行的过滤，返回值无论是布尔列表还是元素列表或者位置列表...组过滤作为行过滤的推广，指的是如果对一个组的全体所在行进行统计的结果返回True则会被保留，False则该组会被过滤，最后把所有未被过滤的组其对应的所在行拼接起来作为DataFrame返回。...题目：请创建一个两列的DataFrame数据，自定义一个lambda函数用来两列之和，并将最终的结果添加到新的列'sum_columns'当中 import pandas as pd data =

871 0

【Python】这25个Pandas高频实用技巧，不得不服！

3更改列名我们来看一下刚才我们创建的示例DataFrame: df 我更喜欢在选取pandas列的时候使用点（.），但是这对那么列名中含有空格的列不会生效。让我们来修复这个问题。...列序反转跟之前的技巧一样，你也可以使用loc函数将列从左至右反转 drinks.loc[:, ::-1].head() 逗号之前的冒号表示选择所有行，逗号之后的::-1表示反转所有的列，这就是为什么...按列从多个文件中构建DataFrame 上一个技巧对于数据集中每个文件包含行记录很有用。但是如果数据集中的每个文件包含的列信息呢？...(10) 你可以看到，每个订单的总价格在每一行中显示出来了。...Style a DataFrame 上一个技巧在你想要修改整个jupyter notebook中的显示会很有用。但是，一个更灵活和有用的方法是定义特定DataFrame中的格式化（style）。

6.4K4 0

pandas.DataFrame()入门

它可以采用不同类型的输入数据，例如字典、列表、ndarray等。在创建DataFrame对象之后，您可以使用各种方法和函数对数据进行操作、查询和分析。...访问列和行：使用列标签和行索引可以访问DataFrame中的特定列和行。增加和删除列：使用assign()方法可以添加新的列，使用drop()方法可以删除现有的列。...数据过滤和选择：使用条件语句和逻辑操作符可以对DataFrame中的数据进行过滤和选择。数据排序：使用sort_values()方法可以对DataFrame进行按列排序。...我们了解了如何创建一个简单的DataFrame对象，以及一些常用的DataFrame操作。 pandas是一个功能强大且灵活的库，提供了各种工具和函数来处理和分析数据。...这些类似的工具在大规模数据处理、分布式计算和高性能要求方面都有优势，可以更好地满足一些复杂的数据分析和处理需求。但是每个工具都有其特定的使用场景和适用范围，需要根据实际需求选择合适的工具。

2251 0

Pandas 2.2 中文官方教程和指南（一）

记住，DataFrame 是二维的，具有行和列两个维度。转到用户指南有关索引的基本信息，请参阅用户指南中关于索引和选择数据的部分。如何从DataFrame中过滤特��行？...如何从DataFrame中选择特定的行和列？我对 35 岁以上的乘客姓名感兴趣。...请记住，DataFrame是二维的，具有行和列两个维度。转到用户指南有关索引的基本信息，请参阅用户指南中关于索引和选择数据的部分。如何从DataFrame中筛选特定行？...如何从DataFrame中选择特定的行和列？我对年龄大于 35 岁的乘客的姓名感兴趣。...当特别关注表中位置的某些行和/或列时，请在选择括号[]前使用iloc运算符。在使用loc或iloc选择特定行和/或列时，可以为所选数据分配新值。

2701 0

Pandas 2.2 中文官方教程和指南（五）

数据集的行基本上是无标签的，除了在DATA步骤中可以访问的隐式整数索引（_N_）。在 pandas 中，如果没有指定索引，默认也会使用整数索引（第一行 = 0，第二行 = 1，依此类推）。...()方法，它接受要排序的列的列表。....; run; 在 pandas 中，Series.isna()和Series.notna()可用于过滤行。...DataFrame 在 pandas 中，DataFrame类似于 SAS 数据集 - 一个具有带标签列的二维数据源，可以是不同类型的数据。....; run; 在 pandas 中，可以使用Series.isna()和Series.notna()来过滤行。

1331 0

挑战30天学完Python：Day25 数据分析Pandas

一个 series 是一个 column，一个DataFrame是一个由series 集合组成的多维表。为了创建pandas series，我们使用numpy来创建一个一维数组或python列表。...如果我们想要有多个列，我们使用 data frames。下面的例子展示了pandas数据框架。 DataFrame 是行和列的集合。...请看下面的表格,它比上面的例子有更多的表列: 接下来，我们将了解如何导入pandas，以及如何使用pandas创建 Series 和 dataframe 引入 Pandas import pandas...的BMI列值是浮点数，让我们格式化一下仅保留一位小数。.../data/hacker_news.csv 文件获取前5行数据获取最后5行数据获得标题，数据作为一个pandas series返回计算这个dataframe的行和列个数过滤包含python的标题

2131 0

Pandas 2.2 中文官方教程和指南（六）

DataFrame 在 pandas 中，DataFrame类似于 Stata 数据集 - 一个具有带标签列的二维数据源，可以是不同类型的数据。...正如本文档所示，几乎可以在 Stata 中应用于数据集的任何操作也可以在 pandas 中完成。 Series Series是表示DataFrame的一列的数据结构。...在 pandas 中，Series.isna()和Series.notna()可用于过滤行。...Stata 中，通过sort来进行排序 sort sex total_bill pandas 有一个DataFrame.sort_values()方法，接受一个要排序的列列表。...在 pandas 中，Series.isna()和Series.notna()可用于过滤行。

1710 0

Pandas图鉴(三)：DataFrames

还有两个创建DataFrame的选项（不太有用）：从一个dict的列表中（每个dict代表一个行，它的键是列名，它的值是相应的单元格值）。...所有的算术运算都是根据行和列的标签来排列的：在DataFrames和Series的混合操作中，Series的行为（和广播）就像一个行-向量，并相应地被对齐：可能是为了与列表和一维NumPy向量保持一致...为了使其发挥作用，这两个DataFrame需要有（大致）相同的列。这与NumPy中的vstack类似，你如下图所示：在索引中出现重复的值是不好的，会遇到各种各样的问题。...，连接要求 "right" 列是有索引的；合并丢弃左边DataFrame的索引，连接保留它；默认情况下，merge执行的是内连接，join执行的是左外连接；合并不保留行的顺序，连接保留它们（有一些限制...比如说：一个解决方案是使用ignore_index=True，它告诉concat在连接后重置行名：在这种情况下，可以将名字列设置为索引。但是对于更复杂的过滤器来说，这就没有什么用了。

3512 0

Pandas GroupBy 深度总结

例如，在我们的案例中，我们可以按奖项类别对诺贝尔奖的数据进行分组： grouped = df.groupby('category') 也可以使用多个列来执行数据分组，传递一个列列表即可。...：按组进行一些操作，例如计算每个组的z-score Filtration（过滤）：根据预定义的条件拒绝某些组，例如组大小、平均值、中位数或总和，还可以包括从每个组中过滤掉特定的行 Aggregation...在我们的 DataFrame 的情况下，让我们过滤掉所有组均值小于 7,000,000 的prizeAmountAdjusted 列，并在输出中仅保留该列： grouped['prizeAmountAdjusted...换句话说，filter()方法中的函数决定了哪些组保留在新的 DataFrame 中除了过滤掉整个组之外，还可以从每个组中丢弃某些行。...如何一次将多个函数应用于 GroupBy 对象的一列或多列如何将不同的聚合函数应用于 GroupBy 对象的不同列如何以及为什么要转换原始 DataFrame 中的值如何过滤 GroupBy 对象的组或每个组的特定行

5.8K4 0

整理了25个Pandas实用技巧

神奇的是，pandas已经将第一列作为索引了： ? 需要注意的是，如果你想要你的工作在未来可复制，那么read_clipboard()并不值得推荐。...或者你想要舍弃那么缺失值占比超过10%的列，你可以给dropna()设置一个阈值： ? len(ufo)返回总行数，我们将它乘以0.9，以告诉pandas保留那些至少90%的值不是缺失值的列。...这里有两列，第二列包含了Python中的由整数元素组成的列表。...你可以看到，每个订单的总价格在每一行中显示出来了。...但是，一个更灵活和有用的方法是定义特定DataFrame中的格式化（style）。让我们回到stocks这个DataFrame: ? 我们可以创建一个格式化字符串的字典，用于对每一列进行格式化。

2.8K4 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云