在cross_val_predict中使用StratifiedShuffleSplit (sklearn)

文章/答案/技术大牛

发布

1回答

python-3.x、scikit-learn、cross-validation

我正在尝试使用有监督的机器学习来根据作物(例如土豆)各自的长度和宽度来预测它们的重量。在拟合特定模型(例如线性回归)之前，我希望根据数据集中特定作物品种的频率对我的特征进行分层采样。这是我使用sklearn (版本0.23)在Python中尝试的代码： import numpy as npfrom sklearn.model_selectionimport StratifiedShuffleSplit from

浏览 57提问于2020-08-19得票数 1

回答已采纳

2回答

从cross_val_score获取概率

python、scikit-learn

我在python中有以下机器学习管道，使用嵌套交叉验证：from sklearn.svmimport SVCsss_inner= StratifiedShuffleSplit(n_splits=

浏览 0提问于2017-11-12得票数 0

回答已采纳

2回答

使用cross_validate()获取预测值

machine-learning、scikit-learn、prediction、cross-validation

我有以下代码，它执行5次交叉验证并返回几个度量值。clf = SVC() 'prec_macro': 'precision_macro',scores = cross_validate(clf, iris.data, iris.target, scoring=scoring,

浏览 3提问于2018-08-08得票数 3

1回答

学习: cross_val_predict只适用于分区

python、scikit-learn、time-series、cross-validation

我正在努力想出如何在sklearn中实现TimeSeriesSplit。from sklearn.model_selection import cross_val_predicttarget = df['target'] clf = svm.SVC(random_state

浏览 8提问于2017-04-07得票数 9

回答已采纳

1回答

通过替换StratifiedShuffleSplit从sklearn.model_selection导入sklearn.cross_validation时，参数应做哪些更改

scikit-learn、cross-validation

我试图运行一个用于隔离语音识别的python3代码，在那里我得到了一个DeprecationWarning，用于使用： TypeError：'S

浏览 0提问于2019-03-24得票数 1

回答已采纳

1回答

Scikit学习导入错误：“cross_val_predict”未定义

scikit-learn、cross-validation

我正在尝试运行一些简单的scikit代码--在python中学习，在执行过程中，我遇到了以下错误：回溯(最近一次调用)：文件""，第1行，从sklearn.cross_validation导入cross_val_predict ImportError:无法导入名称cross_val_predict 我已经下载了scikit，从这个页面

浏览 3提问于2015-04-04得票数 2

1回答

如何将数据发送到scikit以进行交叉验证？

python-3.x、pandas、numpy、scikit-learn

但是，当我想要进行交叉验证时，我会得到以下错误(即使在使用df.values将数据want转换为数组之后)：那我做错什么了？这是我的代码：import numpy as npfrom sklearn import cross_validation df =

浏览 3提问于2016-12-10得票数 0

回答已采纳

1回答

具有阈值的多输出图像分类的分割数据集

python、scikit-learn、split

我使用sklearn.model_selection中的StratifiedShuffleSplit来拆分数据集。但它只适用于1个标签。那么，如何对两个标签进行分层拆分，并为每个标签中每个类别中的样本数量添加阈值？对不起，我的英语不好。from sklearn.model_selection import StratifiedShuffleSplit split = StratifiedShuffleSplit(n_splits=1,

浏览 0提问于2021-10-12得票数 0

1回答

如何获得多标签分类问题的特征重要性？

machine-learning、scikit-learn、classification、feature-selection、multilabel-classification

我正在学习如何使用Scikit学习，我试图得到一个多标签分类问题的特征重要性。make_pipeline(RandomForestClassifier(random_state=42))classifier.classes_ = classes在我试图了解特性的重要性之前，代码似乎运行良好。classifier.feature_importances_ AttributeErr

浏览 5提问于2022-02-06得票数 0

回答已采纳

2回答

训练/测试拆分保留每个拆分中的类别比例

python、machine-learning、train-test-split

假设我想拆分如下所示的NER数据集：Label: ['B-Person', 'O', 'O', 'O', 'O', 'Country']

浏览 1提问于2020-10-14得票数 1

1回答

获取每个交叉验证折叠的混淆矩阵

scikit-learn、pipeline、cross-validation、confusion-matrix

我正在通过交叉验证运行一个逻辑回归的管道，使用scikit-learn。我从下面代码中的每一个折叠中得到分数。我如何得到混淆矩阵？

浏览 0提问于2018-03-31得票数 4

1回答

如何在sklearn中的交叉验证中获得预测结果

python、scikit-learn

我正在使用sklearn交叉验证来解决二进制分类问题。我的代码如下所示。from sklearn import datasetsX = iris.data[:, :2] # we only take the firstcross_val_score(clf, X, y, cv=10, scoring = 'accuracy') 在交叉验证中，cross_val_score仅输出每个折叠的精度。但是，我希望获得分类器为X

浏览 34提问于2019-12-16得票数 1

回答已采纳

1回答

sklearn auc ValueError: y_true中只有一节课

scikit-learn

我使用keras训练一个简单的神经网络，并对分裂的测试数据集进行一些预测。因此，它们很可能在测试标签中没有正标签实例。因此，sklearn的roc_auc_score函数报告了唯一的一类问题。这是合理的。但是我很好奇，因为当我使用sklearn的cross_val_score函数时，它可以毫无错误地处理AUC的计算。cross_validation.cross_val_score(myestimator, data, labels, c

浏览 10提问于2016-08-18得票数 15

1回答

斯克勒夫的课"StratifiedShuffleSplit“

python、scikit-learn、dataset

我对Sklearn的StratifiedShuffleSplit类是如何工作的感到有点困惑。 strat_train_set = housing.loc[train_index] strat_test_set

浏览 3提问于2020-01-10得票数 11

回答已采纳

3回答

对测试数据集使用cross_val_predict

python、machine-learning、scikit-learn、data-science

我对在测试数据集中使用cross_val_predict感到困惑。我创建了一个简单的随机森林模型，并使用cross_val_predict进行预测：from sklearn.cross_validationimport cross_val_predict, KFold lr = RandomForestClassifier(random_stat

浏览 5提问于2017-01-10得票数 7

回答已采纳

1回答

是否有必要在使用StratifiedShuffleSplit拆分数据后使用交叉验证？

machine-learning、scikit-learn、cross-validation

我使用StratifiedShuffleSplit来拆分数据，现在我在考虑是否需要再次使用交叉验证来构建分类模型(Logistic回归、KNN、随机森林等)。我对此感到困惑，因为我在Sklearn中阅读了，我得到的印象是，StratifiedShuffleSplit是同时分割数据和交叉验证数据的混合体。

浏览 12提问于2022-09-17得票数 -1

回答已采纳

1回答

管道衬里标准定标器、递归特征选择和分类器

scikit-learn

我想使用管道实现以下步骤：- Recursive feature selection- cross-validationpredictimport numpy as np from sklearn.metricsimport accuracy_score from sklearn.model_selection impo

浏览 1提问于2018-07-19得票数 0

回答已采纳

1回答

如何计算"OneVsRestClassifier“分类器的准确度？

python、machine-learning、scikit-learn、multiclass-classification

我有一个多类分类问题，下面的代码可以在多类级别对数据进行分类。from sklearn import datasetsfrom sklearn.multiclassimport OneVsRestClassifierfrom sklearn.discriminan

浏览 0提问于2019-08-31得票数 0

1回答

StratifiedShuffleSplit为n_iter报告多个args

python、machine-learning、scikit-learn

我正在尝试使用scikit-learn的StratifiedShuffleSplit对我的数据集进行一次分割，以保留类的样本比率。from sklearn.datasets import load_filesdataset= load_files('reviews/aggregated/') split = StratifiedShuffl

浏览 12提问于2015-11-19得票数 0

回答已采纳

2回答

在python中的for-in循环中放置两个变量是什么意思？

python、pandas、numpy

在一个例子中，我在for循环中看到了这个语法。from sklearn.model_selection import StratifiedShuffleSplit split = StratifiedShuffleSplit(n_sp

浏览 2提问于2017-06-27得票数 0

回答已采纳

点击加载更多