我在R中开发了一个S3类,它的行为与因子变量非常相似,尽管并不完全相同。我在我的实现中留下的唯一解决办法是,factor和as.factor不是泛型。
通过将base::factor函数中的.onload函数重写到包中,我克服了个人使用的这个限制,如下所示:
.onAttach <- function(libname,pkgname){
# note that as.factor is not a generic -- need to override it
methods:::bind_activation(on = TRUE)
# TODO: make a
dat <-
data.frame(keyId = rep(c('A','B','C','D'), times = 4),
group = rep(1:4, each = 4),
value = sample(1:100, 16))
ggplot(dat, aes(x = as.factor(keyId), y = as.factor(value))) +
geom_bar(position = 'dodge', stat = 'identity') +
facet_wrap(~gr
我有一个数据库,它有几个因素。我想对每个变量的每个因子进行迭代回归,但对整个数据库都是如此。如下所示:
for (i in unique(db$Product)) {
for (j in unique(db$Super)) {
for (c in unique(db$Category)) {
db$prueba <- lm(prueba ~ 0 + as.factor(Super)[j] *
(as.factor(Time) + as.factor(Product)[i])
+ as.factor(Category)[c
我使用了Caret的这种特异性,但它没有给出正确的结果。我想我计算的是召回率。有没有人遇到过这个问题? truth = c(1,1,0)
pred = c(1,0,1)
specificity(as.factor(pred), as.factor(truth), positive="1") # output is 0.5 but it should be 0
sensitivity(as.factor(pred), as.factor(truth), positive="1") # 0.5
我正在尝试使用dplyr中的mutate_each来转换数据集的所有数值变量。
library(dplyr)
data(iris)
tbl_df(iris) ->iris
# I can transform all variables in factor
iris %>% mutate_each(funs(as.factor)) %>% summary
# I can transform some variables in factor
iris %>% mutate_each(funs(as.factor),one_of("Sepal.Length"
我一直试图通过使用灰盒中的关联来找出数据集中的所有分类和数字之间的相关性,方法如下-
library(readxl)
library(timeDate)
library(greybox)
library(dplyr)
library(mice)
library(Hmisc)
carData33 <- read.csv("carData.csv")
#removing the first column since its not necessary, it represents the ID number
carData33 <- carData33[,c(2:15