首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >使用dplyr::filter()删除NA观察值

使用dplyr::filter()删除NA观察值
EN

Stack Overflow用户
提问于 2015-03-04 22:59:11
回答 4查看 123.6K关注 0票数 47

我的数据如下所示:

代码语言:javascript
运行
复制
library(tidyverse)

df <- tribble(
    ~a, ~b, ~c,
    1, 2, 3, 
    1, NA, 3, 
    NA, 2, 3
)

我可以使用drop_na()删除所有NA观察结果

代码语言:javascript
运行
复制
df %>% drop_na()

或者删除单个列(例如a)中的所有NA观察值:

代码语言:javascript
运行
复制
df %>% drop_na(a)

为什么我不能只使用普通的!=过滤器管道?

代码语言:javascript
运行
复制
df %>% filter(a != NA)

为什么我们必须使用tidyr中的特殊函数来删除NAs?

EN

回答 4

Stack Overflow用户

回答已采纳

发布于 2015-03-04 23:34:00

来自@Ben Bolker:

这与dplyr::filter()没有特别的关系

来自@Marat Talipov:

与NA的任何比较,包括NA==NA,都将返回NA

来自@farnsy的related answer

==操作符并不像您期望的那样对待NA。

把NA想象成“我不知道那里有什么”的意思。3> NA的正确答案显然是NA,因为我们不知道缺失值是否大于3。嗯,对于NA == NA也是一样的。它们都是缺失值,但真值可能完全不同,所以正确的答案是“我不知道”。

R不知道您在分析中做了什么,所以它不允许比较运算符认为NA是一个值,而不是潜在地引入bug,这些bug最终会让您感到尴尬。

票数 32
EN

Stack Overflow用户

发布于 2017-08-09 04:54:46

例如:

您可以使用:

代码语言:javascript
运行
复制
df %>% filter(!is.na(a))

删除a栏中的NA。

票数 56
EN

Stack Overflow用户

发布于 2020-04-14 03:54:33

如果有人在2020年在这里,在制作完所有的管道后,如果你管道%>% na.exclude将会移除管道中的所有NAs!

票数 33
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/28857653

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档