方法五:数据分箱pd.cut()——最类似于excel中的lookup
构造测试数据
import numpy as np
import pandas as pd
import random
# 随机生成...(40,100) for i in range(60)]).reshape(20,3),columns=["语文","数学","英语"])
df['总成绩'] = df.sum(axis=1)
df
添加一列条件列...# 在conditions列表中的第一个条件得到满足,values列表中的第一个值将作为新特征中该样本的值,以此类推
df6 = df.copy()
conditions = [
(df6['...pd.cut()——最类似于excel中的lookup
方法五 数据分箱pd.cut()——最类似于excel 中 lookup的方法
pd.cut( x, bins, right=True, labels...长度要与分箱个数一致,比如“ bins”=[1、2、3、4]表示(1,2],(2,3],(3,4]一共3个区间,则labels的长度也就是标签的个数也要是3
如果为False,则仅返回分箱的整数指示符,即x中的数据在第几个箱子里