我想检查pandas.DataFrame列是否包含特定值。例如,这个玩具Dataframe在"two"列中有一个"h"
import pandas as pd
df = pd.DataFrame(
np.array(list("abcdefghi")).reshape((3, 3)),
columns=["one", "two", "three"]
)
df
one two three
0 a b c
1 d e f
2 g h i
在我的项目中,我需要检查整个dataframe列中是否存在一些值。示例dataframe:
df=pd.DataFrame([['abc', 'a'], ['def', 'x'], ['aef', 'f']])
df.columns=['a', 'b']
>>>df
a b
0 abc a
1 def x
2 aef f
这个静态代码运行良好:
df['a'].str.contains('f')
此问题是以下问题Check if pandas column contains all elements from a list的扩展 在问题中,为了派生输出,在Pandas列中检查列表的所有成员。我需要检查列表的一个或多个元素,即即使列表中只有一个元素与pandas列中的元素匹配,我也希望在输出中考虑这一点 示例数据将为 frame = pd.DataFrame({'a' : ['a,b,c', 'a,c,f', 'b,d,f','a,z,c']})
letters = ['a','
Pandas Dataframe是否有一种方法只命名第一列或第一列和第二列,即使有4列:
这里
for x in range(1, len(table2_query) + 1):
if x == 1:
cursor.execute(table2_query[x])
df = pd.DataFrame(data=cursor.fetchall(), columns=['Q', col_name[x-1]])
它给了我这个:
AssertionError:传递了2列,传递的数据有4列
我有一个具有下列列和行的数据集
Scored Probabilities for Class "1" Scored Probabilities for Class "2" Scored Probabilities for Class "3" Scored Labels
0.258471 0.009299 0.005433 1
0.154108 0.009577 0.527308