我有一整列数字,其中包括以千为单位的点分隔符和逗号,而不是作为令人沮丧的分隔符的点。当我试图用它们创建一个数值列时,我丢失了所有数据。
var1 <- c("50,0", "72,0", "960,0", "1.920,0", "50,0", "50,0", "960,0")
df <- cbind(var1, var2 = as.numeric(gsub(".", "", as.character(var1))))最后的结果是:
var1 var2
[1,] "50,0" NA
[2,] "72,0" NA
[3,] "960,0" NA
[4,] "1.920,0" NA
[5,] "50,0" NA
[6,] "50,0" NA
[7,] "960,0" NA 我做错了什么?
发布于 2014-01-10 02:04:54
您需要对正则表达式中的"."进行转义,并且需要将逗号替换为".",然后才能转换为数字。
> as.numeric(gsub(",", ".", gsub("\\.", "", var1)))
[1] 50 72 960 1920 50 50 960发布于 2015-11-22 16:14:45
对于这样的事情,我最喜欢scan(),因为它很容易理解。只需使用
scan(text=var1, dec=",", sep=".")遗憾的是,它的速度并不比gsub()快,而seemes却被它压倒了。因此,另一个快速的选项是sub()
as.numeric(sub(",", ".", sub(".", "", var1, fixed=TRUE), fixed=TRUE))以防万一:当您直接从文件读取var1时,只需使用指定的分隔符:read.table("file.txt", dec=",", sep=".")
发布于 2017-12-14 19:44:39
您可以使用"readr“包中的函数"type_convert”。我正在读取一个ODS文件(区域葡萄牙语),并转换数字:
library('readODS')
library('tidyverse')
data <- read_ods('mod-preditivo.ods', sheet=1,col_names = TRUE,range='a1:b30',col_types=NA)
df <- type_convert(data,trim_ws=TRUE,col_types = cols(Pesos=col_integer(),Alturas=col_double()),locale = locale(decimal_mark = ","))
str(df)https://stackoverflow.com/questions/21027806
复制相似问题