今天来看看 Instacart Market Basket Analysis competition 的第二名方案,作者是 Yahoo! JAPAN 的一个数据科学家 Kazuki Onodera (aka ONODERA on Kaggle)
这个比赛是要根据顾客的历史购买记录,预测 Instacart 的消费者将再次购买哪种商品,这样可以在顾客需要这个商品的时候,货源是充足的。
用 XGBoost 建立两个模型,分别预测
分别从 顾客,商品,用户*商品,时间 的角度建立,下面列其中一些特征
顾客:
商品:
用户*商品:
时间:
用 F1 得到概率
然后挑选阈值将概率转化为二进制 1/0 (Yes/No) 不同的购物记录它们的阈值也是不同的