我尝试在R的read.csv
函数中指定时间选项。在我的数据中,第一列“colClasses
”基本上是一个字符向量,而其余的列是数字。
data <- read.csv("test.csv", comment.char="" ,
colClasses=c(time="character", "numeric"),
strip.white=FALSE)
在上面的命令中,我希望R将"time“列读取为"character”,其余部分读取为数字。尽管"data“变量在命令完成后确实有正确的结果,但R返回了以下警告。我想知道如何修复这些警告?
Warning messages:
1: In read.table(file = file, header = header, sep = sep, quote = quote, :
not all columns named in 'colClasses' exist
2: In tmp[i[i > 0L]] <- colClasses :
number of items to replace is not a multiple of replacement length
德里克
发布于 2011-11-19 00:38:21
您只能为一列指定colClasse。
因此,在您的示例中,您应该使用:
data <- read.csv('test.csv', colClasses=c("time"="character"))
发布于 2010-05-11 07:19:32
假设您的“time”列至少有一个观察值包含非数字字符,而所有其他列都只包含数字,那么“read.csv”的默认设置是将“time”作为“factor”读取,而将所有其余列作为“numeric”读取。因此设置'stringsAsFactors=F‘将具有与手动设置'colClasses’相同的结果,
data <- read.csv('test.csv', stringsAsFactors=F)
发布于 2011-12-20 03:53:44
如果您希望引用标题中的名称,而不是列号,则可以使用类似以下内容:
fname <- "test.csv"
headset <- read.csv(fname, header = TRUE, nrows = 10)
classes <- sapply(headset, class)
classes[names(classes) %in% c("time")] <- "character"
dataset <- read.csv(fname, header = TRUE, colClasses = classes)
https://stackoverflow.com/questions/2805357
复制相似问题