我得到了一大组O-D (始发地-目的地)和乘客的交通数据。所有记录都是往返记录。数据可以简化如下:
Ridership Origin Destination
9 A B
6 B A
7 A C
1 C A
3 B C
13 C B我想将从A到B的行程和从B到A的行程识别为相同的往返行程,并将它们的乘客量相加。
最终目标是:
AB = 15, AC = 8和BC = 16
这似乎是一个典型的question...but类型,我真的不知道怎么解决it...Any一有线索吗?谢谢!
发布于 2020-02-07 04:48:05
试试这个:
df.groupby(df[['Origin','Destination']].apply(lambda x: ''.join(sorted(x)), axis=1))['Ridership'].sum()OUtput:
AB 15
AC 8
BC 16
Name: Ridership, dtype: int64https://stackoverflow.com/questions/60103149
复制相似问题