如何设计实时事务数据的体系结构,以便将其归类为欺诈?
利用Scala和星火MLLib的历史数据开发、训练和测试随机森林分类器ML模型,并进行持久化处理。
实时事务数据是利用Apache从一个主题中获取数据,并通过分类器ML模型处理并写入另一个主题进行预测。
我关心的是:我如何提供和获得预测的当前事务数据收到从卡夫卡主题使用上述ML模式?
使用经过训练和测试的ML模型获得预测的在线当前单事务数据的最佳实践是什么?
欢迎任何设计建议。
发布于 2017-08-01 20:36:53
您可以在培训后保存模型,并在实时api中使用它进行预测。例如,对于classifier/predict.html,另一种解决方案可以是使用起泡水和使用POJO:https://github.com/h2oai/sparkling-water/tree/master/examples#step-by-step-through-weather-data-example。
https://stackoverflow.com/questions/45395637
复制相似问题