我使用python处理熊猫数据帧已经有一段时间了。我想将我正在使用的相同代码切换到R。然而,我没有太多使用R的经验,我也不确定我有什么选择来做同样的事情。我有一个包含许多csv文件的文件夹,并且我有一个文件名列表,我希望遍历这些文件并对这些文件进行完整的外连接。 在pandas中,我会运行以下命令, import pandas as pd
filelist = pd.read_excel("/Users/XXX/Documents/test/data/list.xlsx") #contains a list of filenames in the File column ar
我有一个从Excel文件中提取的数据帧列表。数据帧中的一些列被命名为'NA',不包含任何数据,并且是无用的;因此,我想删除它们。该列表包含9个数据框架,大多数列的标题为“NA”。
通过多次迭代,R返回了一个错误或警告。包括:
all_list <- all_list[!is.na(colnames(all_list))]
Warning message:
In is.na(colnames(all_list)) :
is.na() applied to non-(list or vector) of type 'NULL'
由于NA列仍然在每个数据帧中,所
我有一个数据帧,其中包含一个名为ProgramName的变量,该变量包含不同程序的名称,但有时名称会发生变化。我想创建一个函数,为每个程序名创建一个数据帧。类似于subset函数的功能。 数据帧中还有其他还需要过滤的特征,因此下面的代码会处理这些问题 ma <- as.data.frame(Missing_AttendanceKIDS, stringsAsFactors = FALSE)
mi <- as.data.frame(Missing_AttendanceSIS, stringsAsFactors = FALSE)
mi <- mi %>% select(c(
我想在r中以编程方式构建glms,类似于这里描述的(How to build and test multiple models in R),除了测试所有可能的预测变量子集。 因此,对于像这样的数据集,使用结果变量z data <- data.frame("z" = rnorm(20, 15, 3),
"a" = rnorm(20, 20, 3),
"b" = rnorm(20, 25, 3),
"c" = rn
我是R的新手,我尝试使用一个函数来测试包含600多个变量的大型数据帧中的异常值,除了最后两列之外,所有变量都是数字。我尝试了outliers包中的离群值函数,一次测试一列,最后得到了一个我无法使用的数值向量。有没有更好的方法来识别数据帧中的所有异常值。
myout <- c()
for (i in 1:dim(training)[2]){
if (is.numeric(training[,i])) {
myout <- c(myout,outlier(training[,i])) }
}
我希望运行几个cox回归模型,使生存函数保持不变,并设置不同的预测变量,我希望将每个变量保存在一个列表中。此外,我希望从列表中的每个模型中获得一个整洁的输出。
下面是一个有两个预测变量的例子,但是实际的数据帧有超过20个预测变量。
# data frame with first 2 columns specifying time to event and event and rest as predictor variables
df <- some_data_frame
#Cox Models
cox_var1 <- coxph(Surv(time,event) ~ var
我写了一个运行线性模型并输出数据帧的函数。我想要多次运行该函数并堆叠输出。以下是一个假设的数据集和函数:
data = data.frame(grade_level = rep(1:4, each = 3),
x = rnorm(12, mean = 21, sd = 7.5),
y = rnorm(12, mean = 20, sd = 7))
func = function(grade){
model = lm(y ~ x, data=data[data$grade_level == grade,])
fi
我有一个名为AllFramesCoeff的数据帧列表。我想要生成一个随机数,让我的数据帧列表引用这个数字来引用一个随机数据帧,并使用一个for循环对列表中的185个数据帧中的一个使用lm模型。我要它做1000次随机测试。
我还想把lm系数结果放在一个对象中,可能是一个向量。
我的计划是稍后返回并创建直方图、发行版,或者插件新列来重复它。
我试过的是:
m <- matrix(0, ncol = 2)
CorrResults<- as.data.frame(m)
for (i in length(WaFramesCoeff)) function() {
r <- sampl
我正在开发一个闪亮的应用程序来处理数据。我想要读取在fileInput中选择的压缩文件。这个压缩包由多个csv文件组成,我想将所有.csv数据帧保存为反应值。例如,如果test.zip包含文件ONE.csv,TWO.csv,THREE.csv,我想获得3个响应值(以数据帧的形式),称为1,2,3。
如果我知道csv文件的名称和数量,我可以做到这一点。
但是如果我不知道.csv数据帧的数量和名称,我如何实现它呢?
## Only run examples in interactive R sessions
if (interactive()) {
ui <- f
我在从R中的循环返回数据帧时遇到了问题。我有一组函数,可以读取文件并将它们转换为数据帧,供更大的项目使用/可视化。
我有一个要传递的文件名列表:
# list of files to read
frameList <-c("apples", "bananas", "pears")
此函数遍历列表并运行函数以创建数据框(如果数据框尚未存在)。
populateFrames <- function(){
for (frame in frameList){
if (exists(frame) && i