文章/答案/技术大牛

发布

社区首页 >问答首页 >包装器normalizeFeatures在验证集中的行为如何？

问包装器normalizeFeatures在验证集中的行为如何？
EN

Stack Overflow用户

提问于 2019-11-14 13:31:58

回答 1查看 71关注 0票数 3

我想知道normalizeFeatures函数是如何与重采样策略一起工作的。这些说法中哪一条是正确的？

整个任务数据是标准化的
训练数据是标准化的，并且使用标准化的参数(例如，类标准化中的均值和sd )来规范验证数据( mlrCPO::retrafo在某种程度上所做的)。

谢谢你的帮助!

mlr

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-11-14 14:31:10

函数normalizeFeatures()可以在data.frame和Task对象上调用。在这两种情况下，它的作用都是一样的。它只是使整个任务正常化。因此，陈述1)是正确的。

如果您想实现第二步，您有两个选择：

( a) preprocWrapperCaret

包装器将放置训练和预测的缩放信息。对于训练，缩放参数将被保存和应用。对于预测，将应用保存的缩放参数。

library(mlr)
lrn = makeLearner("classif.svm")
lrn = makePreprocWrapperCaret(lrn, ppc.center = TRUE, ppc.scale = TRUE)

set.seed(1)
res = resample(lrn, iris.task, resampling = hout, models = TRUE)

# the scaling parameters learnt on the training spit
res$models[[1]]$learner.model$control$mean

Sepal.Length  Sepal.Width Petal.Length  Petal.Width 
       5.831        3.030        3.782        1.222

res$models[[1]]$learner.model$control$std

Sepal.Length  Sepal.Width Petal.Length  Petal.Width 
   0.8611356    0.4118203    1.7487877    0.7710127

( b) mlrCPO

更优雅和灵活的方法是使用mlrCPO包构建一个预处理管道，在这种情况下，它的效果与包装器相同。

library(mlr)
library(mlrCPO)
lrn = cpoScale(center = TRUE, scale = TRUE) %>>% makeLearner("classif.svm")
set.seed(1)
res = resample(lrn, iris.task, resampling = hout, models = TRUE)
# the scaling parameters learnt on the training spit
res$models[[1]]$learner.model$retrafo$element$state

$center
Sepal.Length  Sepal.Width Petal.Length  Petal.Width 
       5.831        3.030        3.782        1.222 

$scale
Sepal.Length  Sepal.Width Petal.Length  Petal.Width 
   0.8611356    0.4118203    1.7487877    0.7710127

我设置了种子，以获得相同的训练分割为两种情况，以便学习的尺度参数是相同的两种方法。

票数 4

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/58857984

复制

相似问题

问包装器normalizeFeatures在验证集中的行为如何？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问包装器normalizeFeatures在验证集中的行为如何？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问包装器normalizeFeatures在验证集中的行为如何？
EN