我一直在尝试解决这样的问题:将我的数据分组(按贷款编号),然后根据不同的条件,根据某个列(这里是筛选列)的最高或最低值,返回每个组的一行。我意识到我不能使用ifelse来做我想做的事情,但其他示例已经使用了if和else (因此我尝试了)。在此过程中,我遇到了各种各样的错误。在澄清问题的同时,任何帮助都将不胜感激。 Example data
Loan_Number <- c(100,100,100,100,200,200,200,200,300,300,300,300)
Principal_Remaining <- c(50,50,50,50,5,5,0,0,10,10,10,1
我对r不熟悉,我正试图从给定的表格中计算一个指数,我计算了下面表格的最小值、最大值和中位数,我在列中有一些NaN。第一和第二列是纬度和经度,从3开始是土壤湿度。
1 2 3 4 5 6 7 8 9 10 11
28.188 -111.438 NaN NaN NaN NaN NaN NaN NaN NaN NaN
28.188 -111.312 362.74 360.723 361.
我有时需要根据其中一个变量的值从data.frame中提取特定的行。R内置了maximum (which.max())和minimum (which.min())函数,使我可以轻松地提取这些行。
median是否有等效项?或者我最好的选择就是编写我自己的函数?
下面是一个data.frame示例,以及我如何使用which.max()和which.min()
set.seed(1) # so you can reproduce this example
dat = data.frame(V1 = 1:10, V2 = rnorm(10), V3 = rnorm(10),
maxMATX和maxZIM都没有返回任何观察结果,我对此感到非常困惑。
这是代码
library(tseries)
\#teries have all the Financial Data , hence we need to load it
data.ZIM\<- get.hist.quote("ZIM")
data.MATX\<- get.hist.quote("MATX")
data.ZIM\<-data.ZIM\[Sys.Date()-0:364\]
data.MATX\<-data.MATX\[Sys.Date()-0:3
我有一个表,列出了一系列不同的活动(或项目)的事务列表。我想要做的是从每个活动开始时根据每个活动的第一个交易日来推导。数据涵盖了所有活动的所有事务,只有以下两列是相关的: Campaign.ID (数值),Created.At (Yyyy)。这是我目前拥有的:
temp$Recency = as.integer(today() - temp$Created.At) # Get number of days ago
df = temp %>% # Multiple transactions per user - we only need the most recent
group_by
我有一个名为data.frame的newdata,它看起来像:
HospitalName State Rating
CRESTWOOD MEDICAL AL 3
GEORGIANA HOSPITAL AL 7
WEST VALLEY HOSPITAL AZ 5
VERDE VALLEY AZ 6
医院按州分类,然后按等级分类。目前约有50个州。
我将data.frame分解为一个包含data.frames的列表,该列表由国家分隔。
s <-split(newdata,newdata[