首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何从每个类中提取两个值以将其放入测试集中?

如何从每个类中提取两个值以将其放入测试集中?
EN

Stack Overflow用户
提问于 2020-08-25 03:37:33
回答 1查看 94关注 0票数 1

所以我有一个120行124列的数据集。相依列是人员的字符串名。总共有20个不同的名字。我希望从每个类中提取两行(因此为每个类提取具有相同名称的两行),以便我可以使用it.Any帮助创建一个测试集。谢谢

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-08-25 04:37:31

您可以使用以下函数执行此操作:

代码语言:javascript
复制
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.2,stratify =y)

这里,

带有所有自变量的

X = Dataframe。

y =带有因变量的级数。

test_size =您希望作为测试大小的百分比,在这里是20%。

分层=所有类别的平等分布,在您的例子中,它的名称是20人。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63571699

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档