问如何为dataframe中的各个列创建基于不同布尔条件的新列
EN

Stack Overflow用户

提问于 2019-04-29 00:42:01

回答 2查看 132关注 0票数 1

我想创建一个二进制列，如果dataframe中恰好有一列满足逻辑条件A，而dataframe中的另一列满足逻辑条件A或逻辑条件B，则该列标记为yes。因此，如果两个单独的列满足上述条件，新列将只有1。

每一列都是每年的单独产品计数。条件A:如果一个产品(即"c1")在本年度卖出了8个产品，则前一年的1-6个产品和前一年(2年前)的1-6个产品满足条件A。条件B:如果任何其他产品(例如，不是"c1“，即"c3")满足上述条件A，或者在本年度售出8件，前一年售出8件，两年前售出8件，则满足条件B。因此，只有当特定年份中的任意2列满足上述条件时，成功才能为1。一列必须满足条件A，另一列必须满足条件B。

import numpy as np
import pandas as pd
df = pd.DataFrame({'C1':[7,3,2,8,3,4,6,8,3,2],'C2':[2,5,4,8,8,8,3,2,8,4],'C3': [7,5,4,6,7,8,6,8,1,7],
                   'C4':[3,4,4,6,4,2,6,3,2,6],'C5':[6,4,0,8,4,2,6,6,7,8],'Year':[2010,2011,2012,2013,2014,2015,2016,2017,2018,2019]})
df.set_index('Year', inplace=True)
df1 =df[::-1]
df1
_1_CorrA =((df1.eq(8)) & (df1.shift(-1).isin([1,6])) & (df1.shift(-2).isin([1,6]))).sum(axis=1)==1

_1_CorrB =(((df1.eq(8)) & (df1.shift(-1).eq(8)) & (df1.shift(-2).eq(8))) |
              ((df1.eq(8)) & (df1.shift(-1).isin([1,6])) & (df1.shift(-2).isin([1,6])))).sum(axis=1)==1


Strategy = (((_1_CorrA) & (_1_CorrB)))

df1['Success']=np.where(Strategy,1,0)

我希望在索引行2015和2013中看到1，因为这是仅有的两行，其中恰好有两个不同的列满足上述条件。

python

pandas

boolean-logic

回答 2

Stack Overflow用户

回答已采纳

发布于 2019-04-29 01:23:50

成功意味着恰好有两列满足条件A (a.sum(1).eq(2))，或者一列满足条件A，而另一列满足条件B，因此当前年份和前两年的每一年都等于目标值8。

为了确保同一列不同时满足条件A和条件B，我从条件A获取成功列，并确保它不等于条件B的成功列(a.idxmax(1).ne(b.idxmax(1)))。只有在条件A和条件B都只有一次成功时，才会进行这种比较，因此我可以使用idxmax来获取通过该条件的列。

target = 8 
upper_limit = 6
lower_limit = 1
df1_shift1 = df1.shift(-1)
df1_shift2 = df1.shift(-2)

a = (
    df1.eq(target) 
    & df1_shift1.ge(lower_limit) 
    & df1_shift1.le(upper_limit) 
    & df1_shift2.ge(lower_limit) 
    & df1_shift2.le(upper_limit)
)
b = (
    df1.eq(target)
    & df1_shift1.eq(target)
    & df1_shift2.eq(target)
)
success = (
    a.sum(1).eq(2) 
    | (a.sum(1).eq(1) 
       & b.sum(1).eq(1) 
       & a.idxmax(1).ne(b.idxmax(1)))
)
>>> df1.assign(Success=success)
      C1  C2  C3  C4  C5  Success
Year                             
2019   2   4   7   6   8    False
2018   3   8   1   2   7    False
2017   8   2   8   3   6    False
2016   6   3   6   6   6    False
2015   4   8   8   2   2    False
2014   3   8   7   4   4    False
2013   8   8   6   6   8     True
2012   2   4   4   4   0    False
2011   3   5   5   4   4    False
2010   7   2   7   3   6    False

票数 1

Stack Overflow用户

发布于 2019-04-29 01:30:31

我认为你应该使用DataFrame.apply()来帮助你。

例如：

df = pd.DataFrame({'C1':[7,3,2,8,3,4,6,8,3,2], 
                   'C2':[2,5,4,8,8,8,3,2,8,4], 
                   'C3': [7,5,4,6,7,8,6,8,1,7],  
                   'C4':[3,4,4,6,4,2,6,3,2,6], 
                   'C5':[6,4,0,8,4,2,6,6,7,8], 
                   'Year':[2010,2011,2012,2013,2014,2015,2016,2017,2018,2019]})

def my_rule(row):
    C1 = row['C1']
    C2 = row['C2']
    C3 = row['C3']
    C4 = row['C4']
    C5 = row['C5']
    year = row['year']

    # write your rule of C1,...,C5 here
    if ...:
        return 1
    else:
        return 0

df['Success'] = df.apply(lambda row: my_rule(row), axis=1)

希望这能回答你的问题。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/55892435

复制

相似问题

问如何为dataframe中的各个列创建基于不同布尔条件的新列
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何为dataframe中的各个列创建基于不同布尔条件的新列EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何为dataframe中的各个列创建基于不同布尔条件的新列
EN