在W. John Braun和Duncan J. Murdoch第31页(数据帧和read.table函数)的“R统计编程第一课”中,他们解释了
数据集通常由多列数据组成,其中每一列表示单个变量的度量。每行通常表示一个单独的观察。这种格式被称为逐个变量格式. 例如,以下数据集包括对三个变量x、y和z的四个观察:
x y z
61 13 4
175 21 18
111 24 14
124 23 18如果这样的数据集存储在C:驱动器目录中名为
pretend.dat的文件中(这是在Windows中,但我使用的是Mac),那么可以将其读入R数据帧中。这可以是通过键入pretend.df <- read.table("c:/myfiles/pretend.dat", header = T)完成的命令。 在数据帧中,列被命名。要查看x colum,输入pretend.df$x
问题(书) :显示pretend.df的第1行第3列元素。
到目前为止,我用我的Macbook Pro用Excel创建了这个文件(.xlsx还是csv??)。从此,我编写了pretend.df <- read.table("/Users/jg24/Documents/R/Classeur1.xlsx", header = T),并出现了一个错误
Warning messages:
1: In read.table("/Users/jg24/Documents/R/Classeur1.xlsx", header = T) :
line 1 appears to contain embedded nulls
2: In read.table("/Users/jg24/Documents/R/Classeur1.xlsx", header = T) :
line 3 appears to contain embedded nulls
3: In read.table("/Users/jg24/Documents/R/Classeur1.xlsx", header = T) :
line 4 appears to contain embedded nulls
4: In read.table("/Users/jg24/Documents/R/Classeur1.xlsx", header = T) :
line 5 appears to contain embedded nulls
5: In scan(file = file, what = what, sep = sep, quote = quote, dec = dec, :
embedded nul(s) found in input如果我尝试命令pretend.df <- read.table("/Users/jg24/Documents/R/Classeur1.csv", header = T),我得到
Warning message:
In read.table("/Users/jg24/Documents/R/Classeur1.csv", header = T) :
incomplete final line found by readTableHeader on '/Users/jg24/Documents/R/Classeur1.csv'问题:任何人都能告诉我我的最后一个命令出了什么问题,我如何修改它?
P.S.我是RStudio的新用户。有人能用这个软件告诉我这个问题吗?
发布于 2016-10-09 16:44:34
我没有足够的声誉来发表评论,所以我会在这里说:我会简化所有的事情。因此,如果可以的话,将其保存为csv文件,并使用readr包。从那里,你可以打电话给read_csv。
也许更好的是,您可以下载RStudio预览版,并在“环境”选项卡中,单击“导入数据集”,然后按照其余的说明操作。在不知道更多情况的情况下,很难判断这是否有效,但我怀疑这是应该的。
https://stackoverflow.com/questions/39944992
复制相似问题