给出一个示例dataframe,当按'ind‘分组时,我希望将组中的值设置为'Hat’如果'Hat‘在组中。i.e
ind | val ind | val
---------- ---------
1 | Hat 1 | Hat
1 | Cat 1 | Hat
1 | Cat - > 1 | Hat
2 | Dog 2 | Dog
2 | Log 2 | Log
3 | Hat 3 | Hat
3 | Hat 3 | Hat我有下面的代码来告诉我,如果' hat‘在一个组中,但是将该组中的每个值设置为hat的最佳方法是什么?
for i, x in df.groupby('ind'):
if(x['val'].str.contains('Hat').any()): 发布于 2018-05-10 02:11:35
没有groupby或lambda的一种方法是使用pd.DataFrame.loc
import pandas as pd
df = pd.DataFrame({'ind': [1, 1, 1, 2, 2, 3, 3],
'val': ['Hat', 'Cat', 'Cat', 'Dog', 'Log', 'Hat', 'Hat']})
idx = set(df.loc[df['val'].str.contains('Hat', regex=False), 'ind'])
df.loc[df['ind'].isin(idx), 'val'] = 'Hat'
ind val
0 1 Hat
1 1 Hat
2 1 Hat
3 2 Dog
4 2 Log
5 3 Hat
6 3 Hat发布于 2018-05-09 22:15:27
In [101]: (df.groupby('ind')['val']
.transform(lambda x: ['Hat'] * len(x) if x.str.contains('Hat').any() else x))
Out[101]:
0 Hat
1 Hat
2 Hat
3 Dog
4 Log
5 Hat
6 Hat
Name: val, dtype: object发布于 2018-05-10 02:00:48
我会怎么做
df.loc[df.val.eq('Hat').groupby(df.ind).transform('any'),'val']='Hat'
df
ind val
0 1 Hat
1 1 Hat
2 1 Hat
3 2 Dog
4 2 Log
5 3 Hat
6 3 Hat https://stackoverflow.com/questions/50262785
复制相似问题