我有一些代码来自“使用R的行为科学纵向数据分析”(2012),它不起作用。
这就是数据的样子:
subid risk gen eth ell sped att ell2 risk2 grade read
1 HHM F Afr 0 N 0.94 No DADV 5 172
1 HHM F Afr 0 N 0.94 No DADV 6 185
1 HHM F Afr 0 N 0.94 No DADV 7 179
1 HHM F Afr
我想要删除重复项,并保留年份变量最大的那个。我的数据如下所示:
id name year position
1 Jane 1990 Sales
1 Jane 1991 Sales
1 Jane 1992 Sales
1 Jane 1993 Boss
1 Jane 1994 CEO
2 Tom 1978 HR
2 Tom 1979 Sales
2 Tom 1980 PR
2 Tom 1981 Boss
3 Jim 198
我正在尝试计算一些简单的比率,并使用R的括号表示比率的基线。
现在,我正在努力定义一个允许我参数化基线的函数。我不想硬编码它,因为我有几个这样的代码。而且,我真的不明白R到底在做什么,我非常好奇如何实现期望的行为。
下面是一些基于示例数据的代码:
data("singer", package = "lattice")
# this is what I want, but what currently doesn't work
my_ratio <- function(voice) {
ddply(singer, ~ voice.part,
这可能是一个愚蠢的问题,但我没有完成它,在其他地方也找不到这个问题。
我想要一个这样的数据集:
A B
green lizard
blue paper
blue stone
blue scissor
red spock
red stone
变成这样:
A B
green lizard
blue paper, stone, scissor
red spock, stone
我可以用子集来做,但是A有太多的因素。我的循环也不起作用。也许有人有个好主意?
第一,全面披露。我试图严格地在带有相关子查询的MS Access中这样做,并在这篇文章中得到了一些帮助。我一开始以为我的数据很小,可以通过,但它是可怕的。作为另一种选择,我将尝试在R中运行这个程序,然后将结果写入MS Access中的一个新表。我有这样的数据,我有以下字段:
rep, cyc_date, amt
按照Andrie关于滚动5年期(相对于5年平均水平)的链接示例,我试图通过获得amt字段12个月的滚动平均值。这是我的代码:
library(zoo)
library(plyr)
library(RODBC)
# Pull data from local MS Access data
我发现自己一直在使用install.package函数,特别是当我必须尝试别人的代码或运行示例时。
我编写了一个安装和加载程序包的函数。我尝试了以下方法,但不起作用:
inp <- function(PKG)
{
install.packages(deparse(substitute(PKG)))
library(deparse(substitute(PKG)))
}
当我键入inp(data.table)时,它会显示
Error in library(deparse(substitute(PKG))) :
'package' must be of leng