首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >更改R中列的数据类型

更改R中列的数据类型
EN

Stack Overflow用户
提问于 2020-07-27 01:04:02
回答 1查看 65关注 0票数 0

对R非常陌生,需要一些专家的建议。我有一个数据集,其中大约有21列是分类的和连续的。下面是一些例子:测试信用数据

类别变量列,如性别、学历、学生、年龄、..都属于整数类。我想将它们转换为factor数据类型。尝试像这样的东西:

代码语言:javascript
运行
复制
    factorvar=c("Gender","Academic_Qualification","Marital","Repayment_Status_Jan", 
          "Repayment_Status_Feb",   "Repayment_Status_March",   
          "Repayment_Status_April", "Repayment_Status_May", 
          "Repayment_Status_June","agebin")    
for(factor_var in names(Traincreddata)%in%factorvar){
  Traincreddata[factor_var]=as.factor(Traincreddata$factor_var)
  }

然而,我得到一个错误:[<-.data.frame(*tmp*,factor_var,value = integer(0))中的错误:替换有0个项目,需要22500

我知道错误是什么,但我不确定如何修复这个错误。我可以一个接一个地处理所有这些变量,但需要更短的代码。

谢谢你,哈里什

EN

回答 1

Stack Overflow用户

发布于 2020-07-27 01:28:42

names(Traincreddata)%in%factorvar)会给你一个true/false的值。要获取实际名称,请使用names(Traincreddata)[names(Traincreddata)%in%factorvar)]

在任何情况下,您都可以使用lapply而不是for循环

代码语言:javascript
运行
复制
names <- names(Traincreddata)[names(Traincreddata)%in%factorvar)] 
Traincreddata[,names] <- lapply(Traincreddata[,names] , factor)
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63103199

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档