背景:我有一个每月生成的数据集(它类似于每个月包含卡片人口学和交易的卡片数据,并且可以在数据系列的中间添加新的帐户)。根据这些历史数据,我需要建立一个分类模型来预测下个月的二进制标签。
问:哪一种更好的交叉验证分割类型,可以用来得到一个公平的模型分数评估(而不是偏见和低方差)?为了表明这一点,让我们花15个月的培训数据,需要对模型进行5倍交叉验证分割的超调。我下面有两种选择,但如果你有其他的,那也没关系。
的时间序列
的时间序列
谢谢你的回答,非常感谢你的回复。
发布于 2021-09-14 16:49:12
由于您希望构建基于时间顺序表格数据的二进制分类器,我看到了两种可能的方法:

顺便说一句,你的模型应该达到一个良好的偏差-方差权衡,而不是一个完美的“无偏见”模型。
https://datascience.stackexchange.com/questions/102078
复制相似问题