我在记事本里有一些乱七八糟的数据。在保存不同数据的任何不同列之间基本上没有空格。我知道数据的空间。例如,第1-2列是X,第7-10列是Y....
我该如何组织它呢?它可以在R中完成吗?做这件事最好的方法是什么?
发布于 2012-07-20 10:30:46
在这种情况下,?read.fwf
可能是一个很好的选择。
设置文件的路径:
temp <- "\pathto\file.txt"
然后设置文件中变量的宽度,如下所示。
#1-2 = x, 3-10=y
widths <- c(2,8)
然后设置列的名称。
cols <- c("X","Y")
最后,将数据导入到会话中的新变量中:
dataset <- read.fwf(temp,widths,header=FALSE,col.names=cols)
发布于 2012-07-20 08:22:55
我以前做过的处理这种乱七八糟的事情实际上是将它作为分隔宽度文本导入到excel中,然后保存为CSV。
这是给你的一个建议。如果这是一个一次性的项目,那就没问题了。根本不需要编码。但如果是惯犯..。然后你可以看看正则表达式。
即^(.{6})(.{7})(.{2})(.{5})$,依次为6、7、2和5个字符宽度的4个字段。
https://stackoverflow.com/questions/11571148
复制相似问题