如何根据从['Seen_A']列中挑选2的随机列表，将数据帧分割为训练和验证数据集(如下图所示)

、

如何基于从列中挑选2个的随机列表将数据帧分割为训练和验证数据集(如下图所示)。即通过在数据帧列中随机选取几个列表来将其分割成两个<e

浏览 14提问于2021-10-21得票数 0

1回答

从不同的输入集中获取相同分布的数据

、、、

我正在尝试创建一个在多个列表之间平均分布的训练数据集，每个列表都有不同类型的数据。我该怎么做？我查看了GroupKMeansFold和StratifiedFold，但我并不完全理解它。a = [a1, a2, a3.... a10000] c = [c1, c2, c3.... c10000] 我希望我的</e

浏览 0提问于2022-07-29得票数 1

1回答

在python3中划分文本文件以训练和测试数据存储

我有一个类似下面这个例子的数据文件： X Y month day FFMC DMC DC ISI RH wind rain area387 5 5 mar thu 90.9 18.9 30.6 8.0 48 5.4 0.0 0.00 我尝试将其随机分割为训练集和测试集，但基于<e

浏览 0提问于2019-10-22得票数 0

1回答

随机森林:如果测试集也被标记，会有什么不同吗？

、、

我能找到的所有使用随机森林进行预测的例子都已经有了实际的答案(即测试集有标签)。当你没有这个栏目的时候你会怎么做？例如，本教程使用虹膜数据：如果我们真的这样做，测试数据集应该有第1,4列，而不是第5列。如果您尝试在没有第5列的情况下运行此测试数据集，则会引发一个错误，即数据帧的大小不同，显然

浏览 0提问于2013-07-05得票数 3

回答已采纳

2回答

使用类似json的字段填充pandas数据帧

、、

我正在尝试创建一个包含两列'type‘和'waveforms’的数据集，'Type‘将包含一个注释，如'real’或'simulated‘'waveforms’将包含从JSON文件创建的对象。“waveforms”列中的单个条目将如下图所示。而且，行数超过100行。ga

浏览 15提问于2021-05-19得票数 0

1回答

模型的验证和培训损失不稳定。

、、、

下面我已经训练了一个模型，并且显示了训练数据集(蓝色)和验证数据集(橙色)的丢失。根据我的理解，理想的情况是，验证和训练损失都应该收敛和稳定，以判断模型没有不适合或过适合。但我不确定下面的模式。从损失中你能看出什么，好吗？此外，这也是模型的准确性： 📷

浏览 0提问于2022-12-02得票数 2

回答已采纳

1回答

一对一样本的Keras模型训练及验证曲线的绘制

、、

我见过一些帖子在一对一的样本上谈论Keras模型的训练.我也从这些帖子中了解到，Keras模型将更新模型权重，即使是在逐个训练的基础上。那么，在这种情况下，现在的问题是，我们如何提供验证拆分，以及我们如何绘制模型的验证图，因为我们不是将整个数据集提供给我们的模型，而是逐行提供数据集</

浏览 1提问于2021-08-14得票数 1

回答已采纳

1回答

为ConvLSTM2d准备网格天气数据

、、、

我正在尝试使用一个使用每小时网格天气数据的ConvLSTM2d模型。我可以将数据放入具有以下维数(纬度、num_features)的四维数组中。ConvLSTM2d需要5d，我计划为序列长度设置一个变量，可能是24小时。我的问题是，我如何在这个数组中创建一个额外的维度来拥有序列长度维度？(num_hours，sequence_length，lat，lon，num_features)

浏览 3提问于2021-09-28得票数 0

1回答

从python dataframe列中检索字符串的一部分

、、

我正在使用一个Yelp数据集，这是一个熊猫数据帧。每一行包含一个企业的信息，每一列引用一个特定的信息，如消费者评级、类别、属性等。我特别感兴趣的是从数据帧的属性列中提取信息。每行中的属性字段包含多个元素，并且长度不同。我附上一张图片来说明这一点。我想从属性单元格中提取以下信息：'Restaurant

浏览 8提问于2017-06-19得票数 0

1回答

如果模型在验证数据集上表现不佳，怎么办？

、、

即使所有分类器的roc曲线都显示出90%以上的AUC，但一旦我提供了一个验证数据集，该模型几乎无法准确地预测30 %的分类对象。在基于3/4的训练数据集生成模型的同时，对模型进行了训练和测试。我在培训期间做了10次交叉验证，我想代码是正确的。我试着在训练前包括或不包括pca。如损失函

浏览 0提问于2022-05-10得票数 0

1回答

新测试数据( TFLearn )上的LSTM/RNN模型失败

、、、

我对ML相当陌生，目前我正试图开发一个可以通过从音频文件中提取classify spoken digits (0-9)的模型。我在一个由15位演讲者和2400个培训示例(每个数字有240个音频示例)组成的数据集上对模型进行了培训。经过3000 epochs后，该模型的精度达到97%。问题是，当我记录自己的数字wavs时，模型无法正确地分类。为什么会发生这种情况，我能做些什么来解决这个问题呢？这是overfitting的一个例子吗？

浏览 0提问于2018-06-06得票数 0

1回答

从验证精度到测试精度的显著下降

、、、、

给我一个大的训练数据集(>70k样本)和一个独立收集的测试集(~2k)。在测试集上，我始终取得了不错的验证精度，但精度却明显较低。我一直在执行这样的验证： 2)提供10%的训练

浏览 0提问于2019-08-11得票数 3

2回答

Dataset以及为什么使用度量衡()？

、、、

我是从机器学习开始的，我对一些概念有疑问。我读过我们需要将数据集分成训练、验证和测试集。我会问四个与他们有关的问题。 1-训练集:在.fit()中用于学习神经网络中的权值等参数。2-验证集:也可用于.fit()。验证集被使用，这样我们就可以在每个时代结束时验证</em

浏览 0提问于2021-12-03得票数 2

回答已采纳

1回答

如何根据ID将数据帧划分为训练集、验证集和测试集？

、

我需要将我的数据集随机拆分为训练、验证和测试集，如本文()所示，但它需要随机链接到拆分主题ID，而不是整个数据帧。当应用代码回答这个问题时，它完全随机地拆分我的数据帧，但我有堆叠的ID，需要它们留在一起，否则一个主题的数据将</em

浏览 11提问于2017-08-20得票数 3

回答已采纳

1回答

使用sklearn随机拆分数据以进行训练和测试

、

浏览 4提问于2019-10-21得票数 0

1回答

如何从UCI给定的标准数据集生成训练和测试数据集

、

我有一个包含699行和11个属性(包括class属性)的癌症数据集。如何将数据集划分为训练数据集和测试数据集？我知道下面的事情。它们是真的吗？(1)选择初始150行用于测试，剩余549行用于训练(2)选择初始549行用于训练，剩余150行用于测试此外，我是否需要在两个数据集

浏览 3提问于2016-07-01得票数 0

1回答

当我的测试集有我的火车数据没有的数据时，会出现错误吗？

、、、、

我有一个数据集，并将其分为train (80%)和test (20%)集。第一步是建立决策树，然后使用测试集进行预测。train, method = "class")运行此操作后，我将得到一个错误： Model.frame.default中的错误，我有土地"Zypern“在我的测试集，但不是在

浏览 0提问于2018-10-02得票数 1

回答已采纳

1回答

如何使用机器学习解决时间序列问题？

、、、

你好，我有一个时间序列数据，基本上表现为锯齿状。在每个维护周期之后，信号总是在下降之前上升，直到发生维护，这将导致信号再次增加。我正在尝试预测信号，看看如果我计划将来的维护，信号会发生什么情况。我是时间序列的新手，我不确定应该使用哪种模型来预测数据。我研究了交叉相关，但它似乎没有考虑到任何会影响信号的事件，比如我的问题。我只是在每个维护事件之后发生了什么，信号在每个维护周期之后一直遵循着类似的趋势，在每个维护周期之后，信号会上升和下降。有什么建议吗？

浏览 1提问于2020-01-19得票数 1

1回答

正则化误差与过拟合

、、、

我收集了来自50个唯一块的数据，然后将49个块中的数据合并成一个数据集，并将数据从1个块中保存下来用于测试。然后，我使用train_test_split(sklearn)将合并的数据集从49个块中拆分。然后利用训练数据对随机森林回归者进行交叉验证</

浏览 0提问于2020-07-15得票数 1

5回答

数据科学中的训练数据和测试数据

我是python中相对较新的数据科学，在探索一些关于数据科学的竞争时，我对“训练数据集”和“测试数据集”感到困惑。一些项目合并了这两个项目，另一些项目则保持分离。拥有两个数据集的基本原理是什么？任何建议都将是有益的，谢谢

浏览 1提问于2017-04-25得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

从不同的输入集中获取相同分布的数据

在python3中划分文本文件以训练和测试数据存储

随机森林:如果测试集也被标记，会有什么不同吗？

使用类似json的字段填充pandas数据帧

模型的验证和培训损失不稳定。

一对一样本的Keras模型训练及验证曲线的绘制

为ConvLSTM2d准备网格天气数据

从python dataframe列中检索字符串的一部分

如果模型在验证数据集上表现不佳，怎么办？

新测试数据( TFLearn )上的LSTM/RNN模型失败

从验证精度到测试精度的显著下降

Dataset以及为什么使用度量衡()？

如何根据ID将数据帧划分为训练集、验证集和测试集？

使用sklearn随机拆分数据以进行训练和测试

如何从UCI给定的标准数据集生成训练和测试数据集

当我的测试集有我的火车数据没有的数据时，会出现错误吗？

如何使用机器学习解决时间序列问题？

正则化误差与过拟合

数据科学中的训练数据和测试数据

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐