首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >机器学习模型-盲测试

机器学习模型-盲测试
EN

Stack Overflow用户
提问于 2017-10-04 01:32:06
回答 2查看 351关注 0票数 0

我在一个竞赛的模型中工作,我们得到了两个数据集:

Dataset A:确实包含用于训练/测试模型的标签。Dataset B:不包含标签,此数据将用于盲测试,并根据预测分配分数。

我已经准备好了模型,但是当使用函数predict()Dataset B (用于盲测试)时,出现了一个问题,我是否必须应用应用于数据集A?中的相同的预处理步骤(删除重复、NAs、缩放数字特征)?在数据集B中,包含了几个NAs。

提前谢谢你的帮助。

EN

回答 2

Stack Overflow用户

发布于 2017-10-04 05:52:14

我想我将不得不应用相同的预处理应用于数据集A,复制,删除NA,缩放数字特征。因为预测可能会受到影响。朋托斯夫人朋友。

票数 0
EN

Stack Overflow用户

发布于 2017-10-04 06:00:55

当你使用预测函数时,你需要清理你的data.You,如果你想摆脱所有的NAs,你可以使用completecases()函数。除非您有记录号或唯一键,否则不应该删除重复项。

代码语言:javascript
运行
复制
datasetb.2<-datasetb[completecases(datasetb), ]
predicted<-predict(datasetA.model, newdata = datasetb.2)
accuracy<-(actual==predicted)/nrow(datasetb.2)
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/46555720

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档