我正在研究锂离子电池的容量预测模型。
我有10个数据集从10个不同的电池,包括容量和多种功能。每个数据集都是时间依赖的。最后,我想预测某一特定时间的容量。
为此,我想使用所有数据构建一个模型,我不确定如何继续拥有来自10个不同度量的10个数据集。我是否可以将这10个数据集合并为1,然后将完整的数据集划分为训练、测试和验证集?我不确定,因为每个数据集的时间戳是相同的。
发布于 2022-10-19 09:45:44
我建议您将数据集添加到另一个下面,如下所示:
Index Columns
time1 battery1 feature1 feature2 ... y_true=capacity
time1 battery2 feature1 feature2 ... y_true
...
time2 battery1 feature1 feature2 ... y_true
time2 battery2 feature1 feature2 ... y_true
...
然后,您可以对电池进行热编码,并将其作为一个功能(是否,取决于您是否希望找到一些异常值)。
不过,在使用TimeSeriesSplit时要小心。你得先分组然后分头行动。这样,分裂就不会发生在电池批次中间的同一时间代码。否则你会有前瞻性的偏见。
https://stackoverflow.com/questions/74123110
复制相似问题