我必须建立一个基于ML的模型,用50个台站的多年每日观测来预测复杂地形中的降水。除了12个连续变量外,预报因子还包括三个反映地形的变量:海拔、坡度和坡向。由于这三个变量对于单个站点没有变化,我怀疑模型在培训期间是否会依赖这些变量(我还没有开始分析,仍然在编译数据框架)。
我正在考虑编写一个函数,在一个数据框架中,每个观察都随机地改变这三个静态变量,比如+-2%。
发布于 2021-10-25 18:03:25
您有3个变量引用某个特定的站点。
在你的训练中,你只有一个站?--如果是的话,最好的办法就是放弃它们。
在你的训练中,你有更多?
如果你的训练集有一个站,然后在你的测试集中你有另一个站--放下它们。你的模型无法向他们学习。但是有很高的可能性,你有一个数据集移位在你的模型,它不会表现得很好。
https://datascience.stackexchange.com/questions/103486
复制相似问题