from sklearn.preprocessing import StandardScaler
X = df.values[:,1:]
X = np.nan_to_num(X)
Clus_dataSet = StandardScaler().fit_transform(X)
Clus_dataSet
有没有人理解这个上下文的含义?
发布于 2020-08-21 10:26:20
df
是一个包含多个列的DataFrame,显然目标值位于第一列。df.values
返回一个包含DataFrame基础数据的numpy数组,不带任何索引或列名。[:, 1:]
是该数组的一个片段,它返回从第二列开始的所有行和每一列。(第一列是索引0)发布于 2020-11-07 01:12:05
就像Richie说的那样X = df.values[:,1:]
您基本上使X等于您的数据帧,但是它跳过了第一列。
X = np.nan_to_num(X)
将任何NaN值替换为数值。
Clus_dataSet = StandardScaler().fit_transform(X)
规范化数据
Clus_dataSet
返回数据集。
请小心,因为稍后在绘制数据时,如果使用X变量,则必须为第二列中的数据编制索引。
X[0] = df[1]
例如:plt.scatter(X[:, 0], X[:, 3], s=area, c=labels.astype(np.float), alpha=0.5)
the X[:, 0]
包含新变量的第一列,该变量以前是df[:, 1]
如果这有意义的话。很难解释清楚。
发布于 2020-08-21 10:49:26
df.values 为我们提供数据帧值作为 numpy 数组对象。 df.values[:, 1:] 是一种通过索引访问所需值的方式它意味着数据帧中除第 0 个索引列之外的所有行和所有列。
https://stackoverflow.com/questions/63515549
复制相似问题