R包系列——dplyr包教程3

在前面两篇文章中,介绍了dplyr包针对数据框的基本操作,但是dplyr包不仅仅只有这些功能,还有很多其他实用的函数,这篇将介绍在我工作中,用到dplyr包的其他函数。

首先,新建下面用到的数据框,下面示例将以此为基础。

排序

场景:对数据框进行排序。

arrange()函数将数据框所有列按指定列排序。

多条件列

场景:前面使用if_else()函数新增条件列,但是有时候判断的条件不止一个,则需要使用多条件判断函数。

熟悉SQL的童靴,可以看出来该函数与SQL中case when语句很像,没错,功能也是一致的。

去重

场景:常常需要对数据框进行去重。

又一个与SQL相似的地方,连名字一看就知道,distinct()函数实现SQL中distinct语句的功能。

不重复计数

场景:在Power Query中,有个函数实现不重复计数,在dplyr包也有函数实现相同的功能。这个功能常用于计算销售数据中订单数的个数,因为我处理的销售数据中同一订单购买的不同产品是分开来的,但是订单号是一样的。

这个与distinct()函数指定列去重有点类似,只不过增加了计数这个功能。

总结

arrange()函数排序;

case_when()函数多条件判断;

distinct()函数去重;

n_distinct()函数不重复计数;

好了,dplyr包的教程就到此结束了,希望你喜欢dplyr包系列教程。

相关阅读:

R包系列——dplyr包教程1

R包系列——dplyr包教程2

扫一扫,关注我的个人公众号,获取源码,更有各种数据分析视频免费获取。

  • 发表于:
  • 原文链接:http://kuaibao.qq.com/s/20180112A090KT00?refer=cp_1026

相关快讯

扫码关注云+社区