使用Pandas DataFrame、df和函数,如下所示 def code(x):
for item in x:
if x in [21,32]:
return'Cat A'
elif x in [22,34]:
return"Cat B"
else:
print ('sorry') 我有一个DataFrame df,它有一个包含数字的列('Ref') df =
**Document No**
使用Postgres我有一个关于索引以提高效率的一般性问题。
应该为下一个查询创建哪些最好的索引?
SELECT task_name, user_name
FROM tasks
WHERE (user_id = 1 OR task_type = 'SOME_TYPE') and is_deleted = FALSE
GROUP BY task_name, user_name
WHERE子句中的列(user_id、task_type、is_deleted)是否需要与GROUP (task_name、user_name)的索引相同?
OR运算符是否意味着列需要在不同的索引上
我已经预先清理了数据,下面显示了前4行的格式:
[IN] df.head()
[OUT] Year cleaned
0 1909 acquaint hous receiv follow letter clerk crown...
1 1909 ask secretari state war whether issu statement...
2 1909 i beg present petit sign upward motor car driv...
3 1909
我希望选择符合特定条件的列,并将它们添加到生成的DataFrame中。
import pandas as pd
df = pd.read_csv('outputData.csv')
for col in df.columns:
for index in col: #how can I do this?
if(index > 0) #... check some conditions
那么,我如何迭代列的索引呢?或者,是否有更好的方法来做到这一点?
编辑:
要读取的DataFrame如下所示:
col1 col2 col3 ....
1 1
Python 3.9和Pandas 1.3.4
这里是df:
1 First Name Last Name fullname
2 Freddie Mercury Freddie Mercury
3 John Lennon John Lennon
4 David Bowie David Bowie
5 John Doe
6 Joseph Joseph
7 Jovi Jovi
我的代码目前只发现f
我有以下Pandas数据帧:
Index Name ID1 ID2 ID3
1 A Y Y Y
2 B Y Y
3 B Y
4 C Y
我希望添加一个新列'Multiple‘,以指示在ID1、ID2和ID3列中有多个列中有Y值的那些行。
Index Name ID1 ID2 ID3 Multiple
1 A Y Y Y Y
2 B Y Y Y