文章/答案/技术大牛

发布

社区首页 >问答首页 >根据另一个数据的数据删除行？

问根据另一个数据的数据删除行？
EN

Stack Overflow用户

提问于 2021-02-20 16:31:01

回答 2查看 116关注 0票数 0

我现在有一个数据集，它有超过186k的观测值(行)，如图1所示。这些都是BVDID列中的公司，它们应该包含2013到2017年间的所有数据。

missingdata <- series %>% filter(LIABILITIES == 0) %>% select(BVDID)

但是，我使用上面的代码在丢失数据对象中发现了87k行的零值。

如何在缺少数据的数据中使用BVDID (公司代码)删除系列对象的行？此外，在我的str(系列)中，应该有一种方法可以使这些年看起来更好，并根据每个公司代码进行升序。

诚挚的问候

missing-data

回答 2

Stack Overflow用户

回答已采纳

发布于 2021-02-20 16:47:14

有很多种方式，一种这样的方式。

使用tidyverse anti_join函数，它提供的结果类似于set操作A-B，因此将从第二个数据中删除所有匹配的行。

series %>% anti_join(missingdata, by =c("BVDID" =  "BVDID"))

或者直接。Liabilities == 0将返回布尔值，在将这些值转换为0或1之前添加+，并检查这些值的和(如果大于1)，这些值将被删除。

series %>% group_by(BVDID)  %>% filter(sum(+(LIABILITIES == 0)) > 0)

票数 1

Stack Overflow用户

发布于 2021-02-20 16:41:57

series %>% 
  # filter out the BVDIDs from missingdata
  filter(!BVDID %in% pull(missingdata)) %>% 
  # order the df 
  arrange(BVDID, year)

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/66293934

复制

相似问题

问根据另一个数据的数据删除行？
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问根据另一个数据的数据删除行？EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问根据另一个数据的数据删除行？
EN