groupby操作的结果是foll dataframe:
region year
1.0 2015.0 6.775457e+05
2016.0 6.819761e+05
2017.0 6.864065e+05
如何将其转换为foll:
region year val
1.0 2015.0 6.775457e+05
1.0 2016.0 6.819761e+05
1.0 2017.0 6.864065e+05
我尝试使用unstack(),但不起作用
我正在尝试简化Apache (Python)中的dataframe。
我有这样的数据
person X N A B C D
NCC1701 1 16309 false true false false
NCC1864 1 16309 false false true false
...
我想对每一行的X& N进行分组,比如groupBy('X','N'),但是我想得到每一列and出现的频率,比如false =0和true =1,所以我得到了这样的结果
X N A B C D
1 16
我希望将dataframe行合并为一个公共列值,然后将列值的其余部分合并,用逗号分隔字符串值,然后转换为int值的数组/列表。
A B C D
1 one 100 value
4 four 400 value
5 five 500 value
2 two 200 value
预期结果如下:
A B C D
[1,4,5,2] one,four,five,two [100,400,500,200] value
我可以在D列中使用groupby,但是如何将A
我的问题与这里问的但没有回答的问题非常相似
我有一个熊猫DataFame,我想将它组合成一个数据帧
+------+---------+
| team | user |
+------+---------+
| A | elmer |
| A | daffy |
| A | bugs |
| B | dawg |
| A | foghorn |
+------+---------+
成为
+------+---------------------------------------+
| team
从这个问题:Python: Best Way to remove duplicate character from string答案: ''.join(ch for ch, _ in itertools.groupby(string_to_remove) 我知道如何删除重复的字母只存在于彼此相邻的位置,如何将此解决方案应用于pandas中的列? df: df=pd.DataFrame({'A':['ODOODY','LLHHEELLO'],'B':['NNMminee','DDasdss&
我有一个包含分类数据和NaN值的COLOR列的熊猫数据框-
ZIP YEAR COLOR
11111 1990 0
11111 1990 1
11111 1990 NaN
11111 1990 1
22222 2000 0
22222 2000 NaN
22222 2000 NaN
22222 2000 1
如何按ZIP和YEAR列(df.groupby(['ZIP', 'YEAR']))聚合
我有一张数据文件,看起来像:
road dirn length lane
1 L 0 2
1 L 0.6 2
1 L 1.2 1
1 L 0.8 2
2 R 1.5 3
2 R 0.4 2
2 R 9 3
我需要聚合这个数据,在那里我将按列‘路’和'dirn',和列‘长度’,并从列‘车道’中得到最常见的值。结果的dataf
在被问到之前使用的来源:
我做到了所有这一切:
# sort the dataframe
df.sort(columns=['name'], inplace=True)
# set the index to be this and don't drop
df.set_index(keys=['name'], drop=False,inplace=True)
# get a list of names
names=df['name'].unique().tolist()
# now we can perform a lookup on
我希望根据列( DataFrame )的不同分类值(Q14)来划分DataFrame,并为结果的DataFrame分别命名变量。data_int.Q14有4个唯一值(2,3,4,5)。如何使用for循环为DataFrames创建单独的字符串变量名?这是main DataFrame (data_int)的图像
fleet_type = data_int.Q14.unique()
for i in data_int.Q14:
for uni in fleet_type:
if i == uni:
data_'{}'.format{uni} = data