检查dataframe中的列是否包含字符串列表中的任何项_检查列是否包含列表中的任何字符串_检查列表中的任何链接是否包含列表中的任何单词 - 腾讯云开发者社区

、

我想检查dataframe中的列是否包含字符串。我本以为只要检查dtype就可以做到这一点，但事实并非如此。包含字符串的熊猫系列只有dtype 'object'，它也用于其他数据结构(如列表)： df = pd.DataFrame({'a': [1,2,3], 'b': ['Hello', '1', '2'], 'c': [[1],[2],[3]]}) df = pd.DataFrame({'a': [1,2,3], 'b': ['Hello

浏览 4提问于2017-04-03得票数 8

回答已采纳

3回答

Pandas -为列表中的每个项目动态创建空的Dataframe

我有一个包含几个变量名的列表。我正在尝试看看是否可以为每个变量名创建空的Dataframe。 sample_list = ['item_1','item_2','item_3'] 我想为列表中的这3个项目创建一个空的Dataframe。结构也是一样的。它们将有两列，即Product_Name、Quantity。预期输出： Dataframe 1 : item_1 Dataframe 2 : item_2 Dataframe 3 : item_3

浏览 31提问于2020-07-29得票数 0

回答已采纳

1回答

检查df列，其中包含值列表，以确保python中每个子列表中至少有n个元素。

、、

我有一个df，它包含一个列中的一个列表，我想检查列值是否包含列表列表中每个子列表中的至少一个元素。示例： import pandas as pd lstOflst = [['a', '5', '3', 'x'], ['1', 'e'], ['g', '7','x']] data = [ ['a', 'b', ['1','2','a'], '2d']

浏览 6提问于2022-06-28得票数 0

回答已采纳

3回答

如何查询列在另一列中的位置？

、

我有一个dataframe，其中包含带有页面名称的列，以及另一个包含带有页面列表的Json的列。我想检查页面名称是否出现在页面列表中，如果没有则对其进行过滤。我该怎么做呢？ df例如： +---------+--------------------------------+ |page name|page_list | +---------+--------------------------------+ |home |{page_list:['home','something']}| |about

浏览 19提问于2020-01-06得票数 1

1回答

在python中查找列值是否包含在列表中

查找列中的值是否包含在python中的列表中我有一个数据帧'a‘和另一个作为列表'b’。我想找出列表'b‘中是否存在'a’值，如下所示。如果当前打印“找到”否则“找不到” a=['BUHARIREST','SAMCO','MCDONALS'] b=['BUHARIRESTAN','BUHARIHOTEL','SAMCOMUL'] a=pd.DataFrame(a) a['c']=np.NaN a['c']=a['c'

浏览 16提问于2019-05-26得票数 0

2回答

如果列值中包含列表值，则筛选列上的数据。熊猫

、、、、

如果可以在列表中找到列的值，我很熟悉如何过滤数据，但我不知道如何实现反向情况，迭代列表中的值以查看列值是否包含在列值中。例如，我的df有一个列，其值如下： df = pd.DataFrame({'column':['abc', 'def', 'ghi', 'abc, def', 'ghi, jkl', 'abc']}) column 0 abc 1 def 2 ghi 3 abc, def 4 ghi, jkl 5

浏览 2提问于2020-07-23得票数 2

回答已采纳

1回答

如何使用运算符链接项目列表

、

场景我想过滤熊猫的数据。它应该返回包含列列表中有数值的所有行的数据，列表的长度是任意的。示例 a b c 1 1 1 1 2 1 g 8 3 h 1 1 4 2 2 2 如果我用列b、c调用我的函数，我期望行1、3和4；如果我用列a调用我的函数，那么我期望行1、2和4。。我想出了这样一个实现，它感觉不像奏鸣曲，但很有效： import typing import pandas as pd def filter_df(dataframe: pd.DataFrame, filter_columns

浏览 1提问于2022-11-07得票数 1

回答已采纳

2回答

：根据现有列添加新列，该列包含列表列表

、、

我试图在下面的数据栏中添加一个列，这将告诉我一个人是否属于绿色类别。它只显示Y或N，这取决于列类别是否包含它。问题是列类别在某些行中只包含一个字符串，而在另一些行中包含一个字符串列表，甚至在另一些行中包含一个列表。 import pandas as pd df = pd.DataFrame({'user': ['Bob', 'Jane','Theresa', 'Alice'], 'category': [[['green'],['re

浏览 5提问于2021-03-08得票数 0

回答已采纳

2回答

在完整数据中查找excat字符串

、、、

我正在数据like中搜索一个字符串，并希望得到列标题的列表，在那里发生这个excat字符串。我的数据是： df ColumnA ColumnB ColumnC apple app appl banana app banana 现在我想搜索：apple和我应该返回： ColumnA 如果我搜索banana，我应该得到： ColumnA ColumnC 如何获得列标题，其中字符串位于dataframe中？

浏览 4提问于2019-09-30得票数 0

回答已采纳

1回答

如果dataframe_2$column1中的一行包含列dataframe_1$column2中包含的字符串，则匹配，并返回字符串本身

我在dataframe列中有一个关键字列表。示例： - dataframe_1$column_queries query1query2query3query4 然后我有一个dataframe列，其中包含上一列中出现的查询+更多的单词。示例： - dataframe_2$column_complex_queries query1其他单词query2其他单词query3其他单词query4其他单词<code>f 223</code> 我正在创建一个新列，该列分析查询是否包含，然后返回查询。我用下面的代码一个接一个地做： dataframe_2 <- dataframe

浏览 4提问于2021-04-11得票数 0

3回答

检查Pandas DataFrame列中的字符串是否在字符串列表中

、、

如果我有这样的框架 frame = pd.DataFrame({ "a": ["the cat is blue", "the sky is green", "the dog is black"] }) 我想检查这些行中是否包含某个特定的词，我只需要这样做。 frame["b"] = ( frame.a.str.contains("dog") | frame.a.str.contains("cat") | frame.a.str.contains("f

浏览 1提问于2013-07-31得票数 76

回答已采纳

2回答

.isin()用于列的每一行中的值列表

、

我有一个小问题:在我的DataFrame中有一个列，它有多个行，每行包含一个或多个值，开头是'M‘字母，后面是3位数字。如果值超过1，则用逗号分隔。我想要打印出DataFrame的视图，只包含一个列包含我指定的值的行(例如，我希望它们保存列表‘M 111’，‘M 222’中的任何项。我已经开始以以下方式构建我的布尔掩码： df[df['Column'].apply(lambda x: x.split(', ').isin(['M111', 'M222']))] 在我看来，其中包含.apply()方法的.split()首先将

浏览 1提问于2017-05-23得票数 3

回答已采纳

1回答

检查数据帧中的字符串

在一个数据框中，我需要创建一个新列，声明某些汽车是否是国产的。数据框中的第一列列出了汽车的名称，但该列没有名称。如何创建一个代码，将所有国产汽车的名称运行到数据框第一列中的名称，然后在新列中打印yes或no？(我将创建一个包含所有国产汽车的单独列表)我在考虑if else语句，但不知道如何引用数据框中的第一列，因为它没有列名。我还尝试了grep()，并在创建了国内制造商字符串的向量后使用%in%。 domesticmanu <- c("Duster", "Hornet", "Ford", "Valiant", "C

浏览 19提问于2020-10-22得票数 0

4回答

当字符串存在时，熊猫dataframe没有报告匹配的字符串。

、、、、

对python来说很新鲜。这似乎是一个非常简单的问题，但我找不到任何关于它的信息。我有一个字符串列表，对于每个字符串，我想检查它是否存在于dataframe中(实际上在dataframe的特定列中)。不是子字符串是否存在，而是整个确切的字符串。因此，我的数据文件如下所示： A=pd.DataFrame(["ancestry","time","history"]) 我应该能够简单地使用“”方法，如 "time" in A 然而，这会返回False。如果我跑了 "time" == A.iloc[1] 它返回"

浏览 20提问于2022-05-09得票数 0

回答已采纳

1回答

如果列(位置)包含列表中的值，则从dataframe中删除该行。

、、、、

下面是包含三个列和一个列表的示例dataframe 如果列位置包含列表中的值，则我的目标是删除行。如果list有一个值sales，那么我们的代码应该找到并删除行，即使它位于列的字符串位置之间。我已经厌倦了模糊匹配，但这对我没有帮助。

浏览 11提问于2022-11-01得票数 0

1回答

将字符串转换为字典列表

、

我有一个熊猫数据栏，它的元素是'[{"foo": 42, "bar": "conversion"}]'格式的。也就是说，它们都是字典列表(长度不同)，但作为字符串保存在dataframe中。是否有办法使该列包含实际的字典列表？

浏览 1提问于2016-03-04得票数 0

回答已采纳

3回答

在Pandas中添加新DataFrame列不起作用

、、

所以我有一个熊猫DataFrame，里面有2001年亚利桑那州响尾蛇队的击球统计数据。我是Python/Pandas的新手，所以我尝试使用lambda函数添加一些列，如下所示 PA_lambda = lambda row: row.AB + row.BB + row.HBP + row.SH + row.SF OBP_lambda = lambda row: (row.H + row.BB + row.HBP) / (row.PA) if row.PA > 0 else 'NaN' AVG_lambda = lambda row: row.H / row.AB if r

浏览 52提问于2020-06-30得票数 1

2回答

如何检查列值是否包含在列表中？

、、

我试图找出是否有一个函数可以检查星火DataFrame的一个列是否包含列表中的任何值： # define a dataframe rdd = sc.parallelize([(0,100), (0,1), (0,2), (1,2), (1,10), (1,20), (3,18), (3,18), (3,18)]) df = sqlContext.createDataFrame(rdd, ["id", "score"]) # define a list of scores l = [1] # filter out records by scores by li

浏览 0提问于2019-02-19得票数 1

回答已采纳

3回答

Pandas:如果变量为true，则返回功能名称

、、、、

我有一个大约2M字符串的列表和一个大约800个单词的列表。我已经创建了一个数据帧，其中字符串作为行，单词作为列。除了字符串变量之外，所有其他变量都是true或false值，与单词是否在字符串中相对应。不存在缺失值。即 import pandas as pd df = pd.DataFrame({'strings':['a string with california', 'a string with lobster',

浏览 21提问于2019-02-01得票数 1

回答已采纳

1回答

基于列名/字符串条件的PySpark删除列

、、

我希望将列放在包含banned_columns列表中任何单词的pyspark中，并从其余列中形成一个新的dataframe。 banned_columns = ["basket","cricket","ball"] drop_these = [columns_to_drop for columns_to_drop in df.columns if columns_to_drop in banned_columns] df_new = df.drop(*drop_these) banned_columns的思想是删除以basket和cricket

浏览 0提问于2018-07-16得票数 1

回答已采纳

1回答

通过包含空值的列表过滤熊猫的数据

、、、

我有一个dataframe，我需要创建另一个dataframe，它将只包含特定列中缺少的记录。 “‘Missing”意味着它可以是空的、'N/A’、'NODATA‘，或者在某些情况下是其他固定的值(我需要一个函数，这样我就可以传递一个适合情况的列表)。我可以通过值过滤它，这样就可以找到N/As和NODATA记录，但它看不到空记录。我尝试过多种方法，是否可以这样做(因此，空值是列表的一部分)，还是需要单独过滤空值并将其合并到列表中？ def GetEmpty(df, on, items_list=['']): column = df[on] b

浏览 1提问于2021-11-26得票数 2

回答已采纳

2回答

如果列在列表的任何部分，则筛选数据

、、

我正在尝试将数据过滤为列值在列表中的行。但是，列中的值将与列表不完全匹配。我可以做某种通配符或进一步包含吗？例如，基于下面的列表和dataframe，我想返回或过滤到第0行。 list = ["123 ABC", "456 DEF", "789 GHI"] id idlist 0 ABC 1 XYZ 有点像 df_2 = df[df["idlist"].isin(list)] 不起作用，因为它是在寻找精确的匹配。

浏览 0提问于2019-05-21得票数 1

回答已采纳

1回答

避免FOR循环将多个字符串追加到列表中

、、、、

我需要用选定行上的一些字符串来更新DataFrame列，我为这些行建立了索引。到目前为止，我已经通过列表理解实现了我所需要的东西： [data.particleIDs.values[idx[i]].append(particlenames[i]) for i in range(len(idx))] 其中data.particleIDs是需要更新的DataFrame列，particlenames是一个包含字符串的列表，idx是一个数组，对于每个字符串，该数组包含需要写入的DataFrame行。几个字符串对应于同一行，我需要将它们都写在DataFrame列中。假设我有一个DataFrame和我用

浏览 10提问于2020-02-11得票数 3

1回答

星星之火(scala) --检查列中的字符串是否存在于另一个dataframe的列中。

、、

我有一个，我希望检查特定列中的每个字符串是否存在于另一个dataframe的预定义列中。我在中也发现了同样的问题但是，我想检查列中的字符串是否存在于另一个dataframe的列中，而不是一个列表或一个集合中。谁能帮我！我不知道将列转换为集合或列表，也不知道dataframe中的“存在”方法。我的数据类似于 df1： +---+-----------------+ | id| url | +---+-----------------+ | 1|google.com | | 2|facebook.com |

浏览 0提问于2019-07-22得票数 2

回答已采纳

2回答

如何将列表中的项附加到数据帧中的特定列？

、、、、

假设我有一个包含n个项目的字符串列表，比如： list1 = ['a','b',..'y','z'] 我不想将整个列表附加到一个dataframe (这会创建n列)，而是只想将第一项附加到第一列，将最后一项附加到最后一列，并将两者之间的所有内容组合到中间列。我试过了 df = pd.DataFrame(list1) 但这会为每个字符串项创建单独的列，从而产生n列我希望输出是3列的数据帧，如下所示： 0 1 2 0 a b+c+d+.. z 请

浏览 0提问于2019-08-26得票数 4

3回答

如果dataframe包含列中的列表，则在列中查找不同的值。

、

让我们假设我们有以下数据： d = {'col1': [[1,2], [1,2], [2,1]], 'col2': ['A', 'B', 'C']} df = pd.DataFrame(data=d) df col1 col2 [1, 2] A [1, 2] B [2, 1] C 如果在dataframe的列中有一个列表，那么如何计算每个列中的不同值？函数df.nunique()不起作用--它会产生以下错误：TypeError: ("unhashable type: 'list'

浏览 2提问于2019-06-26得票数 2

回答已采纳

2回答

包含列表的Pandas列上的组操作

、

我有一个DataFrame，它包含一个列props，它包含字符串列表。理想情况下，我希望按本专栏进行分组，但可以预见，当我这样做时会得到一个错误： TypeError: unhashable type: 'list' 是否有一种合理的方法来重新安排我的DataFrame以便我可以使用这些值？

浏览 4提问于2013-10-28得票数 6

回答已采纳

1回答

Python -匹配长文本中单词列表的最佳方法

、、、

Problem：我有一个单词列表(在.txt文件中)，其中包含编程语言和相关技术的名称(每行一个技术)，例如： AngularJS Grunt T-SQL MySQL SQL Server SQL Bash Git Android Android Studio Ajax Design patterns Frontend developer 依此类推(这个列表包含大约250个术语，但它肯定会变得更大)。我还有一个熊猫数据栏，列中包含与IT相关的职位的全文(每一行一条)。我想要做的是将另一列添加到现有的dataframe中，在该列中保留职务描述中找到的所有关键字(来自.txt文件)的列表。工

浏览 2提问于2017-06-08得票数 2

2回答

是否有方法将整数列表映射到唯一的数字或唯一的散列？

、、、、

整数列表的排列也应该保留在散列中--也就是说，包含不同顺序的相同数字的列表应该有不同的散列。这样做的一种方法是将整数列表连接到一个字符串中，但是如果列表很大，这可能是一个昂贵的比较测试。 Context：如果我已经有5个大数组“分析”并散列，我将能够快速检查传入的数组是否是新的。

浏览 7提问于2015-10-21得票数 2

3回答

列表中的熊猫栏:如何设置项目的dtype

、

我有一个dataframe，它有多个列包含列表，并且每一行中的列表长度是不同的： tweetid tweet_date user_mentions hashtags 00112 11-02-2014 [] [] 00113 11-02-2014 [00113] [obama, trump] 00114 30-07-2015 [00114, 00115] [hillary, trump, sanders] 00115 30-07-2015 []

浏览 0提问于2019-02-20得票数 2

回答已采纳

1回答

从pandas中的字典列表中删除多级列

、、

我有一个包含多级列的dataframe，如下面的MWE中所示： df = pd.DataFrame([[1,2],[3,4]], columns=[['a','c'],['b','d']], index=['one','two']) df.columns.names = ['aa', 'bb'] 它看起来像这样： In [267]: df Out[267]: aa a c bb b d one 1 2 two 3 4 我还有一个字典列表，如下所示

浏览 0提问于2016-10-05得票数 2

1回答

Spark检查数据帧数组中的任何单词是否包含在另一个列表中？

、

我在spark.It中读取了一个json文件并将其转换为dataframe，其中有一个列skills，其中包含值的列表。现在，我想要过滤数据帧，以便列skills具有另一个列表的任何值。例如： skill= ["A", "B", "C", "D"] and list=["A", "Z"] skill= ["E", "B", "C", "D"] and list=["A", "Z"] 那么筛选器代码应该显

浏览 3提问于2018-12-13得票数 0

1回答

检查一个列表中的任何值是否存在于另一个列表中(最快的解决方案)

、、

我有一个具有1100万行和10列的DataFrame。每一列都是一个元素列表(可以是一个空列表，也可以是一个包含最多5个元素的列表)。假设我有另一个包含100000个元素的lsit，我只想过滤DataFrame中的那些行，对于这些行，给定的列(比如columnA)包含了我的100000个元素的大列表中的任何元素。这是我目前的代码： df = df[df["columnA"].apply(lambda x: any(value in valuesList for value in x))] 但是计算它需要花费大量的时间。我怎样才能加快代码的速度？

浏览 1提问于2022-06-30得票数 0

1回答

如何创建一个新列，将一个列与dataframe中的列表与另一个dataframe的索引相匹配？

、、、、

浏览 3提问于2022-09-09得票数 0

5回答

在/List中搜索多个单词

、、、、

我有一份清单： list = ['United Kingdom', 'Berlin', 'italy'] 和一个DataFrame： location 0 London, United Kingdom 1 BerlinGerman 2 Rome,Italy 所以这里我需要做的是在dataframe中创建一个新列，它只包含列表中的单词。因此，新列应该如下所示： location new_col 0 London, United Kingdom United Kingdom 1 BerlinGerma

浏览 5提问于2020-07-14得票数 1

回答已采纳

2回答

合并包含列表字符串表示的两列熊猫数据

、、、

我有一个dataframe df，其列包含列表的字符串表示形式。 import pandas as pd data = {'A': [['ABCD'], ['PQRS'], ['LMNOP']], 'B':[['YUIO', 'DFGH'], ['QWERT', 'CVDF', 'WERT'], ['BCLF', 'DASE', 'OPIU', 'RTYU']]} df

浏览 6提问于2022-07-21得票数 1

回答已采纳

2回答

如何在pandas中选择与字符串列表匹配的行，而不仅仅是一个特定的字符串？

、

假设我们有一个dataframe- df和一个标记为'A‘的列。对于选择与一个字符串匹配的行-'some_ string '，df‘a’.str.concludes(‘some_string’)效果很好。我的问题是，是否有一个相应的方法可以传递给包含字符串列表的方法，以便可以获得部分匹配？我可以给它一个字符串列表而不是'some_string‘吗？我试图避免使用for循环和切片数据帧并将其连接成新的数据帧。假设数据帧是 pd.DataFrame(np.array([['cat', 2], ['rat', 5], ['

浏览 9提问于2019-03-08得票数 2

回答已采纳

2回答

熊猫get列在所有行中都包含字符

、、、

我想得到包含有两个空格的所有行的dataframe列的列表。输入： import pandas as pd import numpy as np pd.options.display.max_columns = None pd.options.display.max_rows = None pd.options.display.expand_frame_repr = False df = pd.DataFrame({'id': [101, 102, 103], 'full_name': ['John Brown&

浏览 6提问于2020-03-31得票数 2

回答已采纳

4回答

如何筛选出包含列表列中特定子序列的Pandas DataFrame中的行？

、、、

我有一个DataFrame，如下所示： df = pd.DataFrame({"id": [1, 2, 3, 4, 5], "list": [[2, 51, 6, 8, 3], [19, 2, 11, 9], [6, 8, 3, 9, 10, 11], [4, 5], [8, 3, 9, 6]]}) 我希望过滤这个DataFrame，以便它只包含X是子序列的行(，因此X中元素的顺序与列表中的相同，并且它们不被列表中的其他元素交织)。例如，如果是X = [6, 8, 3]，我希望输出如下所示： id list 1

浏览 6提问于2021-05-26得票数 2

回答已采纳

1回答

根据列表中的存在创建新的布尔熊猫列

、

我有一个熊猫数据栏，它由标准数值列和包含值列表的附加列(char)组成。我不想将这些编码为列表，而是为所有列表中的每个可能值创建列，并将列表是否包含每个可能的值作为每个唯一值的布尔列进行编码。输入- Dataframe char id 1 [a, b, c] 2

浏览 1提问于2019-12-19得票数 0

回答已采纳

1回答

检查一行的元素是否位于另一行中。

、、

我有一个包含2列、1列包含数字和另一列包含列表的dataframe，我想检查带有数字的列是否在包含该列表的列中。测试数据： preds = [[40, 50, 21], [40, 50, 25], [40, 50, 21]] target = [40, 50, 40] df_testing = pd.DataFrame(list(zip(preds, target)), columns =['preds', 'target']) 例如，在第一行中，我想检查40是否在40，50，21，对于第2行，我想检查50是否在40，50，25等等。期

浏览 1提问于2022-01-27得票数 -1

回答已采纳

2回答

统计数据帧中特定单词的出现次数

、

我有一个dataframe，它的列Token包含一个单词字符串。对于数据帧每一行中Token列中的字符串，我想计算特定单词出现的次数。输入： 0 ['uno', 'dos', 'one', 'two', 'tres', 'quatro',... 1 ['uuh', 'sugar', 'pie', 'honey', 'bunch', 'kno... 2 ['cant',

浏览 27提问于2021-05-04得票数 1

回答已采纳

1回答

Python，使用dataframe列匹配和替换字符串列表

、

我有一个名为content的dataframe列，其中包含tweet。我已经创建了一个特定单词组合的列表，例如 ls=["Apple Watch","Fitbit Device"] 我正在努力编写一个函数，它将遍历列表中的每个项目，如果在content tweet列中找到这些项目中的任何一个，它将在dataframe列(Content)中将原始"Apple Watch“字符串中的空格替换为"applewatch"，将"Fitbit Device”替换为"fitbitdevice“。提前谢谢你！

浏览 0提问于2018-10-16得票数 0

2回答

迭代pandas dataframe中的行，匹配列表中的元组，并创建一个新的df列

、、、、

我有一个数据帧，其中包含一列元组(df.row_col)，需要使用元组列表进行搜索。如果列表中的元组出现在dataframe列中，我希望返回该行并向dataframe中添加一个新列。我尝试过这种列表理解，但我不确定是否可以遍历这样的列表。非常感谢您的帮助！ data_tuples= [(7, 45), (13, 34), (17, 51), (17, 52), (17, 53), (17, 54), (17, 55), (18, 50

浏览 0提问于2020-08-25得票数 0

3回答

如何将多个变量传递给python中的函数？

、

我想比较几对pandas数据格式中的一个列，并将共享值写入一个空列表中。我已经编写了一个函数，它可以用一对数据文件来完成这个任务，但是我似乎无法将它放大。 def parser(dataframe1,dataframe2,emptylist): for i1 in dataframe1['POS']: for i2 in dataframe2['POS']: if i1 == i2: emptylist.append(i1) 其中'POS

浏览 15提问于2015-04-20得票数 0

回答已采纳

3回答

如何处理包含字符串值的Pandas dataframe列，获得唯一的单词

、、

我试图对包含列表的dataframe列(称为dimensions)执行一些基本操作。当dataframe列包含一个列表时，像df['dimensions'].str.replace()这样的基本操作是否有效？对我来说不管用。我还试图使用re.sub()方法替换列中的文本，但它也没有工作。这是我的dataframe中的最后一列： **dimensions** [50' long] None [70ft long, 19ft wide, 8ft thick] [5' high, 30' long, 18' wide] ，这

浏览 1提问于2021-06-29得票数 0

回答已采纳

4回答

如果包含列表的列包含来自另一个较大列表的元素，如何输出布尔值？

、、

我有一个列，其中每一行都包含不同长度的字符串列表。我需要创建一个新列，其中包含一个布尔(相当于原始列表)的列表，以说明每个元素是否在另一个(更大的)列表中找到。这就是我正在做的事情，而且它显然是行不通的。我是从这个问题出发的： data = [ [1, ["cat", "cat", "mouse"]], [2, ["dog", "horse"]], [3, ["cat"]], [ 4, np.nan, ], ] df = p

浏览 9提问于2021-12-23得票数 2

回答已采纳

6回答

如果列的任何行包含特定的字符串，则选择列。

、、

如果列中的任何值包含字符串，则尝试获取DataFrame中的列列表。例如，在下面的dataframe中，我希望得到字符串中有%的列的列表。我可以使用for循环和series.str.contains方法来完成这一任务，但是for看起来并不是最优的，特别是在更大的数据集中。有没有更有效的方法来做到这一点？ import pandas as pd df = pd.DataFrame({'A': {0: '2019-06-01', 1: '2019-06-01', 2: '2019-06-01'},

浏览 0提问于2019-06-21得票数 7

回答已采纳

1回答

检查列是否包含列表中的值，返回值

、

我有一个df： d = {'id': [1,2,3,4,5,6,7,8,9,10], 'text': ['bill did this', 'jim did something', 'phil', 'bill did nothing', 'carl was here', 'this is random', 'other name', 'other bill',

浏览 2提问于2018-10-22得票数 2

回答已采纳

1回答

在dataframe - python中查找重复的连续字符

、

我有一个有名字列的csv。我的任务是找到有双字母(两个连续的字母重复)的名字。如果名称中包含双字母，则需要在Dataframe中为TRUE创建列，如果不包含，则为FALSE。我相信((\w)\2{1，})有必要的正则表达式，但是当我试图将它添加到Dataframe时，新列是空的。 df['repeat'] = df['Name'].str.findall('((\w)\2{1,})')

浏览 2提问于2021-07-03得票数 1

回答已采纳