在pandas中,可以通过计算列值的总和来确定bins的阈值。具体步骤如下:
下面是一个示例代码:
import pandas as pd
import numpy as np
# 创建DataFrame对象
data = {'A': [1, 2, 3, 4, 5],
'B': [6, 7, 8, 9, 10],
'C': [11, 12, 13, 14, 15]}
df = pd.DataFrame(data)
# 计算每列的总和
sums = df.sum()
# 确定bins的数量和范围
max_sum = sums.max()
min_sum = sums.min()
bins = np.linspace(min_sum, max_sum, num=5)
# 将数据分配到bins中
df['bin'] = pd.cut(sums, bins)
# 打印结果
print(df)
这段代码将创建一个包含3列的DataFrame对象,并计算每列的总和。然后,根据总和的最大值和最小值确定bins的数量和范围。最后,使用cut()函数将总和分配到bins中,并将结果存储在一个名为'bin'的新列中。
请注意,这只是一个示例代码,实际应用中需要根据具体的数据和需求进行调整。
推荐的腾讯云相关产品和产品介绍链接地址:
以上是腾讯云提供的一些相关产品和服务,供您参考。
领取专属 10元无门槛券
手把手带您无忧上云