下面是一个样本数据集和几行令我困扰的代码。我不知道如何将这些派生变量(Year和Session)转换为数字,这样我就可以获得正确的摘要并使用"subset“函数。
##Generate sample dataset
df=data.frame(StudyAreaVisitNote=c("2006 Session 1","2006 Session 2", "2008 Session 4", "2012 Session 3"))
##Create new column denoting year and session on their own
as.factor(df$StudyAreaVisitNote)
df$Year <- substr(x = df$StudyAreaVisitNote, start = 1, stop = 4)
df$Session <- substr(x = df$StudyAreaVisitNote, start = 13, stop = 14)
##Summary of Data
summary(df) ## Year and Session are Class and Mode "Character", summary provides little info
##Turn Year and Session into Numeric
as.numeric(df$Year)
as.numeric(df$Session)
##Try Summary of Data Again
summary(df) ## Again, Year and Session are Class and Mode "Character", summary provides little info发布于 2014-09-14 03:43:41
台词
as.factor(df$StudyAreaVisitNote)
as.numeric(df$Year)
as.numeric(df$Session)请勿永久更改df中的值。它们返回打印到控制台的转换后的向量,然后,因为您没有将它们保存在任何地方,所以一旦完成对该行的调用,它们就会消失。通常R中的对象不会通过引用进行更新,您必须始终将返回的结果重新分配到您想要存储它的任何位置。所以试一试
df$Year <- as.numeric(df$Year)
df$Session <- as.numeric(df$Session)相反,
发布于 2014-09-14 03:43:31
你不能把它们分配给任何东西...
as.numeric(df$Year)
as.numeric(df$Session)应该是:
df$Year <- as.numeric(df$Year)
df$Session <- as.numeric(df$Session)https://stackoverflow.com/questions/25826951
复制相似问题