首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >R:插入包的createDataPartition函数中的y参数是做什么的?

R:插入包的createDataPartition函数中的y参数是做什么的?
EN

Stack Overflow用户
提问于 2022-07-30 13:14:32
回答 1查看 158关注 0票数 0

我正在学习如何在包createDataPartition()中使用caret函数,并且不理解参数的作用。

据我所知,函数返回的列表是抽样行,而不是值。在这种情况下,为什么要费心选择y呢?

EN

回答 1

Stack Overflow用户

发布于 2022-07-30 13:49:06

如果您转到caret主帮助页的caret部分,您将看到以下内容:

函数createDataPartition可用于创建数据的平衡拆分。如果该函数的y参数是一个因子,则随机抽样发生在每个类中,并应保留数据的总体类分布。

选择y的理由是能够更容易地在结果中保留总体的类分布。正如讨论过的这里一样,培训数据中的不平衡类可能存在许多问题。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/73175921

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档