我有一个数据框架,我想创建基于以下逻辑的回收箱:绑定的阈值是5。
,
bin1 = 'm1','m2','m3','m4','m5‘bin2 = 'm6','m7’bin3 = 'm8','m9','m10'
关于绑定有很多问题,答案涉及qcut和cut。但我不确定他们是否为我的案子工作,或者我不知道如何应用于我的案件。提前谢谢你抽出时间。
df = pd.DataFrame({'Marker': ['m1','m2','m3','m4','m5','m6','m7','m8','m9','m10'],
'Position': [0,0.5,0.6,2,5,7,8.4,15,16,17]})发布于 2021-11-04 17:40:02
使用floordiv
df['Cluster'] = df['Position'].floordiv(5).astype(int).factorize()[0] + 1输出:
>>> df
Marker Position Cluster
0 m1 0.0 1
1 m2 0.5 1
2 m3 0.6 1
3 m4 2.0 1
4 m5 5.0 2
5 m6 7.0 2
6 m7 8.4 2
7 m8 15.0 3
8 m9 16.0 3
9 m10 17.0 3https://stackoverflow.com/questions/69843435
复制相似问题