首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >理解read.csv代码的困难

理解read.csv代码的困难
EN

Stack Overflow用户
提问于 2015-07-10 08:38:17
回答 2查看 69关注 0票数 1

我正在提高我的R-技能,重建一些他们在博客上做的令人惊奇的事情。现在我试着复制这个:http://wiekvoet.blogspot.nl/2015/06/deaths-in-netherlands-by-cause-and-age.html。此摘录的相关数据集可在以下位置找到:

95&D1=0-1%2c7%2c30-31%2c34%2c38%2c42%2c49%2c56%2c62-63%2c66%2c69-71%2c75%2c79%2c92&D2=0&D3=0&D4=0%2c10%2c20%2c30%2c40%2c50%2c60%2c63-64&HD=150710-0924&HDR=G1%2cG2%2cG3&STB=T

如果我正在深入研究代码(在第一个链接的底部找到),并且正在运行这段代码:

代码语言:javascript
运行
复制
 r1 <- read.csv(sep=';',header=FALSE,
    col.names=c('Causes','Causes2','Age','year','aantal','count'),
    na.strings='-',text=txtlines[3:length(txtlines)]) %>%
select(.,-aantal,-Causes2)

有人能帮我把这里的步骤分开吗?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2015-07-10 08:48:14

下面是对read.csv()调用中的每一行从您的示例中所做的解释。请注意,最后一个参数text的赋值很复杂,并且依赖于上面提供的链接中的脚本。从较高的级别来看,他首先从包含字符串"Centraal"的文件"Centraal"中读取所有行,只使用筛选集中的第三行到最后一行。还有一个额外的步骤应用于这些行。

代码语言:javascript
运行
复制
r1 <- read.csv( # columns separate by semi-colon
               sep=';',
                # first row is data (i.e. is NOT a header)
               header=FALSE,
                # names of the six columns
               col.names=c('Causes','Causes2','Age','year','aantal','count'),
                # treat hyphen as NA
               na.strings='-',
                # read from third line to final line of the original input
                # Overledenen__doodsoo_170615161506.csv, after some
                # filtering has been applied
               text=txtlines[3:length(txtlines)]) %>% select(.,-aantal,-Causes2)
票数 2
EN

Stack Overflow用户

发布于 2015-07-10 08:58:55

read.csv,读取csv文件,用分隔符";“分隔列,以便这样的输入a;b;c将分隔为: column=a,second=b,third=c。

header=FALSE ->它指定原始文件中没有标头。

col.names将列出的名称分配给r中的列

Na.string= '-‘用’-‘替换NA值

Text=txtlines3:length(Txtline)从第3位置一直读到末尾。

%>%选择(.,-aantal,-Causes2)过滤数据帧

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/31336158

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档