我面试了一家欧洲银行的初级数据科学职位,我得到了这个案例:
我们希望开发能够预测客户未来支出的模型。假设我们有关于客户进行了数年的所有交易的数据(时间、金额、收件人等)。
我想,首先,我们应该尝试预测每月支付,如保险,水或互联网,但我完全不知道该使用哪种算法。你能帮我从哪里开始读什么书吗?
发布于 2017-11-02 10:10:27
未来支出这一术语含糊不清,特别是它可能意味着NPV,它是所有未来权重调整后现金流的总和。这会更复杂一些,因为折价因素是另一个随机变量。我想我们应该谈谈一段时间的付款估计数,例如一个月。
我认为你一开始就走在正确的轨道上:定期还款(抵押贷款、互联网、公用事业等)更容易预测,其中一些甚至可能有非常严格的时间表。此外,也有随机支付,当然有一个不同的分布。
我会这样对待它(不是100%肯定这是最好的方式,但至少看起来是合理的):将定期和不定期的支付分为两种不同的分配,即不同的模式。
x(n) -> x(n+1)
或[x(n-1), x(n)] -> x(n+1)
)来预测它,因为通常情况下似乎有一种模式。但在现实中,算法的选择在很大程度上取决于数据。有可能在时间序列中出现季节性,这当然会影响选择。有了这两种支付来源的模式,我们就可以估算出总支出。顺便说一句,如果雇主对这个问题有任何意见,请与我分享。
发布于 2019-09-22 02:51:01
用线性回归算法预测未来费用
https://stackoverflow.com/questions/46917509
复制相似问题