我有一个数据帧,第一列有11行,我想创建第二列,计数从1到4,然后重置计数,从1到4,当到达最后一行时停止计数。 例如,我有df['item'],代码应该创建一个df['new column'] df['item']= [a b c d e f g h i j k]
df['new column'] = [1 2 3 4 1 2 3 4 1 2 3]
我正在尝试使用函数从熊猫的多个列中计算多个列。该函数采用三个参数-a-、-b-和-c-并返回三个计算值-和、-prod-和-“-”。在我的熊猫数据框架中,我有三个对联-a-,-b-和-c-,我想从它们中计算出列-和-,-prod-和--。
只有当我只有三行时,我所做的映射才能工作。我不知道哪里出了问题,虽然我希望它必须选择正确的轴。有人能解释一下正在发生的事情以及我如何计算我想要的值吗?下面是我测试过的情况。
初始值
def sum_prod_quot(a,b,c):
sum = a + b + c
prod = a * b * c
quot = a / b / c
我有一个有三列的数据
a b c
[1,0,2]
[0,3,2]
[0,0,2]
并需要根据层次结构创建第四列,如下所示:
如果a列有值,则d列=列a
如果a列没有值,但b有,则列d=列b
如果列a和b没有值,但c有,则列d=列c。
a b c d
[1,0,2,1]
[0,3,2,3]
[0,0,2,2]
我是python的新手,不知道从哪里开始。
编辑:我尝试了以下方法,但如果a列为空或为空,它们都不会返回d列中的值
df['d'] = df['a']
df.loc[df['a'] == 0, 'd'] = d
我有一个数据框架,第一列“原始数据”如下所示:
Raw Data
USGS 162 1994-10-15 14 A
USGS 162 1994-10-16 49 A
USGS 162 1994-10-17 39 A
......
我正在尝试创建一个新的数据框架,它现在有两列而不是1。第一列有日期,第二列有整数值,所以如下所示:
Date Integer
1994-10-15 14
我知道您可以使用strptime()和format()提取年份、月和日,但当单元
我有一个带有2列的DataFrame --一个列有单词,另一个列有pos_tags。
word1 tag1
0 Why WRB
1 is VBZ
2 this DT
3 happening NN
4 to TO
5 us PRP
6 Asterix NNP
7 and CC
8 Obelix NNP
如何再添加两个列,其值为“word1”和“tag1”列的(Word1)th值;
word1 tag1 word2 tag