我正在提高我的R-技能,重建一些他们在博客上做的令人惊奇的事情。现在我试着复制这个:http://wiekvoet.blogspot.nl/2015/06/deaths-in-netherlands-by-cause-and-age.html。此摘录的相关数据集可在以下位置找到:
95&D1=0-1%2c7%2c30-31%2c34%2c38%2c42%2c49%2c56%2c62-63%2c66%2c69-71%2c75%2c79%2c92&D2=0&D3=0&D4=0%2c10%2c20%2c30%2c40%2c50%2c60%2c63-64&HD=150710-0924&HDR=G1%2cG2%2cG3&STB=T
如果我正在深入研究代码(在第一个链接的底部找到),并且正在运行这段代码:
r1 <- read.csv(sep=';',header=FALSE,
col.names=c('Causes','Causes2','Age','year','aantal','count'),
na.strings='-',text=txtlines[3:length(txtlines)]) %>%
select(.,-aantal,-Causes2)有人能帮我把这里的步骤分开吗?
发布于 2015-07-10 08:48:14
下面是对read.csv()调用中的每一行从您的示例中所做的解释。请注意,最后一个参数text的赋值很复杂,并且依赖于上面提供的链接中的脚本。从较高的级别来看,他首先从包含字符串"Centraal"的文件"Centraal"中读取所有行,只使用筛选集中的第三行到最后一行。还有一个额外的步骤应用于这些行。
r1 <- read.csv( # columns separate by semi-colon
sep=';',
# first row is data (i.e. is NOT a header)
header=FALSE,
# names of the six columns
col.names=c('Causes','Causes2','Age','year','aantal','count'),
# treat hyphen as NA
na.strings='-',
# read from third line to final line of the original input
# Overledenen__doodsoo_170615161506.csv, after some
# filtering has been applied
text=txtlines[3:length(txtlines)]) %>% select(.,-aantal,-Causes2)发布于 2015-07-10 08:58:55
read.csv,读取csv文件,用分隔符";“分隔列,以便这样的输入a;b;c将分隔为: column=a,second=b,third=c。
header=FALSE ->它指定原始文件中没有标头。
col.names将列出的名称分配给r中的列
Na.string= '-‘用’-‘替换NA值
Text=txtlines3:length(Txtline)从第3位置一直读到末尾。
%>%选择(.,-aantal,-Causes2)过滤数据帧
https://stackoverflow.com/questions/31336158
复制相似问题