我正在尝试使用XGBOOST对时间序列数据进行二进制分类,并为不同的客户提供不同货币的销售变量。不同的货币(基本上是不同范围的可变货币)会对模型产生重大影响吗?我能想到的两个解决办法是:
第二个解决方案会起作用吗?还是我应该坚持第一个方案。
发布于 2019-02-26 15:55:11
第一个解决方案是有效的。对于给定的特性,所有行都需要保留相同的单元。但是对于货币,您应该注意可能取决于数据收集日期的换算率。
对于第二个解决方案,我不太确定您的最终应用程序,但是如果您试图将货币类型的影响结合到您的模型预测中,您可以使用它。但是,如果您提议将其作为第一种解决方案的替代方案,则您的模型将不太可能推断出各种货币类型之间的换算率。
https://datascience.stackexchange.com/questions/46247
复制相似问题