我是机器学习和Apache Spark使用的初学者。
我遵循了https://databricks-training.s3.amazonaws.com/movie-recommendation-with-mllib.html#augmenting-matrix-factors的教程,并成功地开发了该应用程序。现在,由于要求今天的web应用程序需要由实时建议提供支持,我希望我的模型能够为服务器上不断出现的新数据做好准备。该网站引用了:
为您获得推荐的更好方法是首先训练矩阵分解模型,然后使用您的评级增强模型。
我该怎么做?我正在使用Python开发我的应用程序。另外,请告诉我如何持久化模型以再次使用它,或者如何将其与web服务接口。感谢你
发布于 2017-10-20 16:14:46
我不认为在线学习对于Spark中的ALS是可能的。这意味着你不能在实时获取数据的同时更新模型。但是,您可以使用该模型来获得预测。
https://stackoverflow.com/questions/28724639
复制相似问题