例如,我在Pandas中有dataframe:
Col1 Col2
A 1
B 2
C 3
现在,如果我想再添加一个名为Col3的列,该列的值基于Col2。在公式中,如果Col2 > 1,则Col3为0,否则为1。因此,在上面的示例中。输出将为:
Col1 Col2 Col3
A 1 1
B 2 0
C 3 0
有关于如何实现这一点的想法吗?
发布于 2013-09-22 17:55:59
你只是做了一个相反的比较。if Col2 <= 1
。这将返回一个布尔级数,其中大于1的值为False
,另一个值为True
。如果将其转换为int64
数据类型,则True
将变为1
,False
将变为0
。
df['Col3'] = (df['Col2'] <= 1).astype(int)
如果您想要一个更通用的解决方案,您可以根据Col2
的值将任何数字赋给Col3
,您应该这样做:
df['Col3'] = df['Col2'].map(lambda x: 42 if x > 1 else 55)
或者:
df['Col3'] = 0
condition = df['Col2'] > 1
df.loc[condition, 'Col3'] = 42
df.loc[~condition, 'Col3'] = 55
发布于 2018-06-03 16:44:33
我找到的向DataFrame添加列的最简单方法是使用"add“函数。下面是一段代码,也是CSV文件的输出。请注意,包含"columns“参数允许您设置列的名称(恰好与我用作数据源的np.array的名称相同)。
# now to create a PANDAS data frame
df = pd.DataFrame(data = FF_maxRSSBasal, columns=['FF_maxRSSBasal'])
# from here on, we use the trick of creating a new dataframe and then "add"ing it
df2 = pd.DataFrame(data = FF_maxRSSPrism, columns=['FF_maxRSSPrism'])
df = df.add( df2, fill_value=0 )
df2 = pd.DataFrame(data = FF_maxRSSPyramidal, columns=['FF_maxRSSPyramidal'])
df = df.add( df2, fill_value=0 )
df2 = pd.DataFrame(data = deltaFF_strainE22, columns=['deltaFF_strainE22'])
df = df.add( df2, fill_value=0 )
df2 = pd.DataFrame(data = scaled, columns=['scaled'])
df = df.add( df2, fill_value=0 )
df2 = pd.DataFrame(data = deltaFF_orientation, columns=['deltaFF_orientation'])
df = df.add( df2, fill_value=0 )
#print(df)
df.to_csv('FF_data_frame.csv')
https://stackoverflow.com/questions/18942506
复制相似问题