train_test_split在索引切片后未删除y训练和测试变量

腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

1回答

、、、

我多次将train_test_split()用于索引切片，但由于某些原因，它保留了y训练和测试集的预测值。下面是示例数据，以及训练/测试切片和形状。= nypd_dummies.iloc[:, :2] xtrain_dummy, xtest_dummy, ytrain_dummy, ytest_dummy = train_test_split(X_dummies, <em

浏览 3提问于2018-08-22得票数 0

回答已采纳

2回答

在Python中执行SVM时的值错误

、、

我的数据集有5000行和4列：我将数据分成20%的测试和80%的培训：并得到一个形状为(4000,4)的列车和(1000,4)的测试svclassifiersamp

浏览 2提问于2019-11-11得票数 0

回答已采纳

1回答

训练和测试拆分缺少标题和索引名称

、、、、

我正在将数据集分割为训练集和测试集， X_train, X_test, y_train, y_test = train_test_split(X.values, y.values, test_size= 0.20, random_state=99) 但是，在拆分之后，训练和测试集没有列名和索引名。

浏览 17提问于2021-06-17得票数 0

回答已采纳

2回答

这是为x_test和y_test获取相同个体的方法吗？

、、

x_train, x_test = train_test_split(x, test_size = 0.3,random_state=250)这就是在x_test和y_test以及x_train和y_train中相同的个体的匹配方式吗？

浏览 0提问于2019-07-09得票数 1

回答已采纳

1回答

如何基于python中的条件创建train_test_split

、、

我知道如何使用基本的train_test_split但是，如果我想将我的训练和测试集除以一个变量，在本例中是y

浏览 8提问于2020-09-05得票数 0

1回答

ValueError:发现样本数量不一致的输入变量：[140，70]

datasetTrain = pd.read_csv('D:/set_AB.csv')y= datasetTest 我收到以下错误 ValueError

浏览 8提问于2021-10-04得票数 0

1回答

一次热编码后预测

、、、

: Age、Name_Alex、Name_Bob、Name_Clarke、Country_India、Country_SriLanka、Country_USA在列车和测试中拆分数据集 x_train,x_test,y_train,y_test=train_test_split(x

浏览 1提问于2019-02-20得票数 5

回答已采纳

3回答

利用新数据进行SKLearn预测

、、

regressor = LinearRegression()y_pred = regressor.predict(x_test) ??但是，我该如何使仅仅是我的10个新数据--摄入的卡路里数--并使它成为我希望回归者预测的测试集？

浏览 0提问于2018-05-04得票数 4

2回答

按特定变量拆分训练和测试数据

、、

我正在尝试这个代码，将数据拆分成逻辑回归的训练和测试： ""“ from sklearn.model_selection import train_test_split X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.3, random_state=10) "&

浏览 22提问于2021-01-23得票数 0

1回答

EarlyStopping()的使用能抵消validation_split造成的过度拟合问题吗？

、、

Keras允许用户在拟合模型的同时，使用参数"validation_split“将数据分割为训练/测试样本。示例：model.add(Dense(3, activation = 'relu'))model.fit(X_train, y_train,validation_split = 0.2) 然而，我的直觉表明，使用validation_split (相对于创建训练，<em

浏览 0提问于2020-11-24得票数 -1

回答已采纳

2回答

train_test_split的一个标记

、、、、

我有一个按日期索引的pandas数据。假设从1月1日到1月30日。我想将这个数据集分成X_train、X_test、y_train、y_test，但是我不想混淆日期，所以我希望将训练和测试样本除以特定的日期(或索引)。我在努力 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, rando

浏览 0提问于2018-12-06得票数 4

回答已采纳

2回答

训练，测试，验证分裂的Python。三套

、、、

有人提出了将数据集拆分为三组的解决方案。我想知道这个箱子的标签在哪里。或者如何设置标签。

浏览 3提问于2019-11-27得票数 3

回答已采纳

1回答

如何按账号拆分训练数据和测试数据(单变量)

、、

我在试着拟合逻辑回归。我想按帐户划分训练和测试数据(一个不起作用的变量)。我希望将它们按帐户拆分，并且每个帐户可以有很多变量。例如，80%的帐户将进行培训，20%的帐户将进行测试。我尝试过以下方法，但这段代码只给了我80%的训练和20%的随机测试。然后在训练数据中，它会给我一些帐户，但在测试数据中，它也会给我准确的帐户，只是不同的变量。这不是我想

浏览 12提问于2019-05-29得票数 0

回答已采纳

1回答

在特定步骤缩放/规范化数据之间的差异

、、、

我正在使用MinMaxScaler规范化方法，但是我已经看到了可以这样做的各种方法，我想知道在以下方面是否有任何实际的区别：代码12.将数据分解为列车和测试后的数据标准化/规范化，然后对

浏览 0提问于2020-10-05得票数 1

回答已采纳

1回答

KeyError：“[Int64Index([112,113，..121，\n .\n 58,559]，\n dtype=‘in 64’，length=448)]都不在[列]中

、、、

但是，在执行以下代码后，我会得到以下消息错误： dataset = pd.read_excel("un.xls") X=dataset.iloc[:,:-1] y=dataset.iloc[:,-1:], y_test = train_test_split(X, y, te

浏览 0提问于2021-08-12得票数 0

回答已采纳

2回答

样本少的随机森林& test_scores的变异

、

Y(在train_test_split之后)的分布如下。(蓝色列车和红色测试)保持test_size=0.3 (稍等)，并在训练集上执行GridSearchCV，并使用生成的best_params_初始化一个新模型，我将得到一个0.83的测试分数。sco =[] X_train, X_test, y_train, y_test = train_test_split</

浏览 0提问于2023-01-13得票数 1

3回答

(训练测试分裂科学学习)

、、、、

from sklearn.model_selection import train_test_split在这个上下文中，X_train、X_test、y_train、y_test意味着什么?

浏览 0提问于2019-08-30得票数 2

回答已采纳

1回答

训练/测试分割目标检测

、、、、

我试过用这种方式学习train_test_split：data.head()y = data['class']X_train, X_test, y_train,

浏览 0提问于2020-03-05得票数 1

1回答

一个来自不同(测试)文件的代码数据如何与一个文件中的所有数据相比较？

、

我遇到过的所有示例都在一个文件中包含数据，以方便地展示train_test_split的工作方式(或者任何模型)。但通常训练数据和测试数据是两个独立的文件。因此，我制作了一个非常基本的逻辑回归训练文件和测试文件，由两列组成，“年龄”，“保险”。并将df的df_train命名为df_test。我意识到df_test没有经过训练，因此出现了错误，但是...这不是重点吗？我知道model.predict(X_test)不会抛出错误，但这是基于训练</

浏览 1提问于2019-09-25得票数 1

7回答

方法"train_test_split“中的”分层“参数(scikit学习)

、、、

我正在尝试使用train_test_split从package学习，但我遇到了参数stratify的问题。以下是代码：y = iris.target 然而，我一直遇到以下问题： raise TypeError("Invalid parameters passed: %s&qu

浏览 21提问于2016-01-17得票数 143

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云