管道处理避免了中间变量的生成,从而节省了内存,并且使代码直观易读,很大程度的简化代码。
R语言中,管道运算符为“dplyr”包中的“%>%”,指左边的结果作为参数,传入右边的函数。默认左边的结果作为右面函数中的第一个传入参数,或者唯一缺失的参数。
运用iris数据集,介绍管道运算符的使用。
首先导入数据并加载dplyr包。
当右侧函数只有一个参数时,以计算iris数据集第一列均值为例:
第二种方式中,“.”代表了输入参数的位置。第三种方式中,虽然去掉了括号,但是函数功能没有改变。
当右侧函数有两个输入参数时,以用iris数据集前两列生成新数据框,并查看前六行为例:
注意通过上述三种表示,得到结果中第一列和第二列数据的顺序。且右侧函数输入参数列表中如果出现“,”,相应位置必须加入“.”表示左侧传入参数。
当我们选取列表或数据框中对象时,需要用到“$”符号,但是当数据文件中有很多变量时,多次使用“$”会很麻烦,这时可以用attach()函数,连接数据,使得可以直接通过变量名来获取变量中的信息。detach()为撤销相应操作。
机器学习养成记