首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >什么是df.values[:,1:]?

什么是df.values[:,1:]?
EN

Stack Overflow用户
提问于 2020-08-21 10:12:16
回答 4查看 7.3K关注 0票数 0
代码语言:javascript
运行
复制
from sklearn.preprocessing import StandardScaler
X = df.values[:,1:] 
X = np.nan_to_num(X)
Clus_dataSet = StandardScaler().fit_transform(X)
Clus_dataSet

有没有人理解这个上下文的含义?

这里是screenshot!!

EN

回答 4

Stack Overflow用户

发布于 2020-08-21 10:26:20

  • df是一个包含多个列的DataFrame,显然目标值位于第一列。
  • df.values返回一个包含DataFrame基础数据的numpy数组,不带任何索引或列名。
  • [:, 1:]是该数组的一个片段,它返回从第二列开始的所有行和每一列。(第一列是索引0)
票数 3
EN

Stack Overflow用户

发布于 2020-11-07 01:12:05

就像Richie说的那样X = df.values[:,1:]您基本上使X等于您的数据帧,但是它跳过了第一列。

X = np.nan_to_num(X)将任何NaN值替换为数值。

Clus_dataSet = StandardScaler().fit_transform(X)规范化数据

Clus_dataSet返回数据集。

请小心,因为稍后在绘制数据时,如果使用X变量,则必须为第二列中的数据编制索引。

X[0] = df[1]

例如:plt.scatter(X[:, 0], X[:, 3], s=area, c=labels.astype(np.float), alpha=0.5)

the X[:, 0]包含新变量的第一列,该变量以前是df[:, 1]如果这有意义的话。很难解释清楚。

票数 1
EN

Stack Overflow用户

发布于 2020-08-21 10:49:26

df.values 为我们提供数据帧值作为 numpy 数组对象。 df.values[:, 1:] 是一种通过索引访问所需值的方式它意味着数据帧中除第 0 个索引列之外的所有行和所有列。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63515549

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档