我想计算一下“?”的出现次数。“成人”数据帧中所有变量的值。
dataset.workclass[dataset.workclass == '?'].count()
给我'workclass‘列的出现次数。
然而,当我这样做的时候:
for column in dataset:
dataset.column[dataset.column == '?'].count()
给了我一个错误:
'DataFrame' object has no attribute 'column'
我正在尝试使用lambda函数来计算dataframe B中dataframe A值的出现次数。
例如: df_a:
col_a
a
b
c
d
h
df_b:
col_b
d
d
f
q
a
a
a
p
m
c
我想解决这个问题的方法是这样的:
df_a["count"] = df_b.apply(lambda x: len(x[x.col_b == <item_in_df_a>]))
但我在这方面并不是很成功。如何使用lambda函数实现计数?我不太确定上面的lambda表达式是否正确。
list = [a, b, c, d, e, f, g, h] 如何在python dataframe中的特定列上编写和循环上面的列表,这样结果将是... 数据帧: 列N(例如) a
b
c
d
e
f
g
h
a
b
c
d
e
f
g
h
...
(many times)
...
a
b
c
d
e
f
g
h 或者,有没有其他方法可以在不需要使用list的情况下执行上面的转换?非常感谢。
我希望将每个组的所有非零值转换为零,直到python dataframe列中的最后一个零出现。 group | value | Result
a | 1 | 0
a | 2 | 0
a | 0 | 0
a | 1 | 0
a | 0 | 0
a | 1 | 1
a | 2 | 2
b | 1 | 0
b | 0 | 0
b | 2 | 2 我可以想到的一种实现方法是颠倒value列,并将其上面的元素与每个组的元素相
我有以下数据帧ds,它是通过.merge获得的
Date_x Invoice_x Name Coupon_x Location_x Date_y \
1 2017-12-24 700349.0 John Doe NONE VAGG1 2017-12-24
2 2017-12-24 700349.0 John Doe NONE VAGG1 2017-12-24
4 NaN NaN Sue Simpson NaN