首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >在spark/scala中使用不同的预处理交叉验证多个模型

在spark/scala中使用不同的预处理交叉验证多个模型
EN

Stack Overflow用户
提问于 2017-07-09 20:56:12
回答 1查看 288关注 0票数 3

我在Scala中使用Spark。我想对我的数据做不同的预处理。有没有办法让CrossValidator使用多个模型(也使用ParamMaps)来获得这两个模型中的最佳模型?例如,我想做的是:

代码语言:javascript
运行
复制
val discretizer = new QuantileDiscretizer()
  .setInputCol("column1")
  .setOutputCol("column1disc")
  .setNumbuckets(5)
val normalizer = new Normalizer()
  .setInputCol("column1")
  .setOutputCol("column1norm")

val lr1 = new LinearRegression()
  .setFeaturescol(discretizer.getOutputCol)
  .setMaxIter(10)
val lr2 = new LinearRegression()
  .setFeaturescol(normalizer.getOutputCol)
  .setMaxIter(10)

val pipeline = new Pipeline().setStages(Array(dicretizer,normalizer,lr1,lr2))

现在,我想让我的CrossValidator从lr1和lr2这两个型号中挑选最好的一个。这只是一个小例子,我想用ParamMaps将它扩展到多个这样的可能性。

EN

回答 1

Stack Overflow用户

发布于 2018-02-28 20:25:14

您应该能够使用像How to use CrossValidator to choose between different models中那样的自定义估计器来评估这些模型。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/44996632

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档