如何在R中根据数据帧的行长来子集数据帧列表_通过在R中设置数据帧列表的子集来创建数据帧列表列表_如何根据r中的值列表设置数据帧子集 - 腾讯云开发者社区

r、dplyr、tidyverse

我有一个这样的数据帧列表：我想知道如何保留15列的数据帧，并在R中删除列表中的其他数据帧。

浏览 3提问于2021-10-03得票数 2

回答已采纳

1回答

对anova摘要的名称数据框架

r、dataframe

很抱歉，如果这已经得到了回答，但我发现很难得到答案，我的R问题！我的问题是如何以一种有用的方式存储多个anovas的结果。我正在使用'aov‘对数据帧的子集执行anovas，一次比较两个数据帧，使用以下功能： doAnova = function(first, second) { aov(number ~ factor1+factor2, data=rbind(first, second)) } 这是用来比较每一个子集与一个“基本”案例，以检查显着性差异。为了在多个数据集上执行此操作，我在一个循环中使用它： for (name in names) { result

浏览 1提问于2012-03-08得票数 0

回答已采纳

2回答

R中数据帧列表中的平均值

r、list、dataframe

我对R比较陌生，有一个复杂的情况需要解决。我已经将超过1000个数据帧的列表上传到R中，并将其称为列表x。我想做的是获取某些数据帧，并取整个数据帧(不包括每个数据帧的第一列)的均值和方差，并将其保存到两个单独的向量中。例如，我希望获取列表中从元素(3)到元素(54)的每三个数据帧的均值和方差。所以我最终想要的是两个向量： meanvector=c(mean(data frame(3)), mean(data frame(6)),..., mean(data frame(54))) variancevector=c(var(data frame (3)), var(data frame (6)

浏览 0提问于2013-02-26得票数 1

回答已采纳

1回答

在由lapply分配给数据帧的过程中发生了什么

r、dataframe、lapply

给定数据帧df和应用于df的函数f： df[] <- lapply(df，f) 用来自lapply的列表中的向量集合替换df中的列，R的魔力是什么？我看到lapply的结果是一个与dataframe df同名的向量列表。我假设已经完成了一些神奇的映射，将向量映射到df[]，这是df (methinks)中列的集合。就行了吗？试着更好地理解，这样我就能记住下一次要用什么。

浏览 14提问于2021-04-23得票数 0

回答已采纳

1回答

如何提取与R中的主题ID列表匹配的行？

我有一个包含多个主题I的数据帧(每个主题都有重复的观察)。我还有一个单独的dataframe，其中只包含我想要匹配的主题ID列表，并从较大的dataframe中提取。如何以允许我引用不同数据帧中的SubjectID列表的方式编写代码？

浏览 5提问于2021-03-10得票数 0

2回答

如何按列值在数据帧列表中选择行

我有一个包含四个数据帧的列表(Lfs01)，每个数据帧都有不同数量的列和行。我想通过一列中的值(如果是== 1)过滤所有数据帧中的行。变量在前两个数据帧中称为"a“，在最后两个数据帧中称为"A”。我以前看过类似的问题，但不幸的是，我没有找到解决办法。以下是我尝试过的一些事情： data<-lapply(lfs01, function(x) filter(x ,'a'==1)) data<-lapply(lfs01, function(x) filter(x ,'a'==1|'A' ==1)) 结果:列出4个0行

浏览 3提问于2019-12-01得票数 1

回答已采纳

1回答

将具有相同列名的数据帧的s列组成一个矩阵

arrays、r、matrix

如何从初始数据帧(包含列p1到ps)生成包含s个变量的比例p1 to ps的矩阵P 这是一个R问题。我有一个数据帧，其中包括变量p1到ps以及其他变量。我想将变量p1到ps的值从数据帧转移到矩阵P中，以便在其他例程中使用。当我知道列数s(在下面提供的示例中，s=5)时，我可以使用下面的代码(对于一个5列的示例，测试数据在dataframe ALL_test中)。下面的代码读入示例数据帧ALL_test。 ALL_test <- data.frame( x = c(50,75,45), p1 = c(1, 0, 0), p2 = c(0, .4, .1), p3 = c(0, .2,

浏览 3提问于2016-01-27得票数 0

2回答

设置多列NA取值范围(仅限于base和car套餐)

r、packages、base

如何在R中仅使用base、car和外部包对数据集进行某种形式的批量重新编码？我使用的是一台政府计算机，所以我不能安装任何额外的软件包来简化这项工作。理想情况下，我希望能够为car的重新编码函数提供数据帧，或者将重新编码函数应用于数据帧中的所有/大多数变量。我正在试图弄清楚如何使用apply/lapply函数，但我不知道如何使用它们，也没有太多成功。这个想法看起来像下面这样，尽管这段代码不能工作：对于数据帧“df”中的向量2到92： df<-recode(df[2:92], '98:100=NA) 有什么建议吗？我将不胜感激。

浏览 0提问于2011-08-17得票数 1

回答已采纳

1回答

for循环中的子设置

r、loops、for-loop、subset

我正在研究R中的模糊匹配脚本，在这里，我需要在列表中对每个国家的数据帧进行子集，然后对每个国家进行匹配。然而，我对R中循环的知识是相当低的。此脚本应该返回每个国家在非洲国家列表中的子集。对如何使这一细分工作有什么建议吗？谢谢! afrobaro <- data.frame(country=rep(c("Benin","Uganda","Mali"),each=5), region=c("Benind1","Benin2","Benins3","

浏览 2提问于2014-02-01得票数 0

回答已采纳

1回答

使用窗口大小和滑动来划分数据框并将其保存到多个数据框中

我是R语言的新手。我想划分一个具有窗口大小的数据帧，然后slide.and将所有这些数据帧保存为单独的数据帧。例如，我的“数据帧有20行”。然后我想用window size=5和slide=3来划分这些行。所需的输出应为..前5行应该在一个数据帧中，然后第二数据帧应该包含5行，将数据帧的前3行保留为slide =3。这意味着第二数据帧应该包含LAS2行的第一数据帧和剩余的3行数据帧。我的数据框..期望的输出应该是：

浏览 0提问于2017-05-09得票数 1

1回答

这个对象的类型是什么?如何处理它？

r、list、dataframe

我迷失了R中的以下对象： # create a list of filenames files <- list.files("directory", full.names = TRUE) # read all files as csv data <- lapply(files, function(x) (data.frame(read.csv(x)))) 这很好，但我不知道数据的类型，也不知道如何掌握它。让我们看看： data[1] [[1]] Date value1 value2 ID 1 2003-01-01 NA NA

浏览 1提问于2015-04-19得票数 0

1回答

有办法循环多个数据帧以删除相同的列吗？

r、loops、dataframe、data-manipulation

我在R中有不同的数据框架，我想删除相同的四列，在整个循环中迭代所有这些列的过程。当我使用子集并在单个数据帧上进行选择时，代码行可以正常工作。然而，当我尝试某种迭代时，我总是会遇到一些错误。下面，我做了几次尝试假设我有两个数据框架A和B，我想为它们删除列sex、age、citizen和unit。当我使用子集并在单个数据帧上选择时，很好： A=subset(A, select = -c(sex,age,citizen,unit)) 然后，我尝试创建两个数据框架的列表，并使用如下for循环： df.list <- list(A, B) for(i in 1:2) { df.lis

浏览 1提问于2019-04-26得票数 0

2回答

如何根据下一次出现的情况在R中设置数据帧的子集？

r、dataframe、subset

请允许我详细说明。基本上，我有一个包含4列的数据帧，其中一列中有NA。当NA确实发生时，它们总是以组的形式出现。我正在逐行遍历此数据帧，查看列。我想要做的是，一旦我找到NA，我想在达到正常值之前，将数据帧从该行子集到最后一次出现NA的行。例如，让我们看一下我的数据帧df： C1 C2 C3 C4 C5 C6 R1 2 1 2 1 0 0 R2 2 2 1 1 0 0 R3 0 0 1 1 2 1 R4 2 2 1 NA 0 0 R5 0 0 1 NA 2 1 R6 0 0 1 NA 2 1 R7 2 2 1 NA 0 0 R8

浏览 2提问于2013-07-12得票数 0

回答已采纳

2回答

如何编写一个for循环，将多个csv文件读入R，并对数据进行子集，从而为ggplot创建干净的数据帧？

r、loops、subset、gsub、assign

我正在尝试将多个csvs读取到R中，然后通过使用' subset‘函数删除不需要的列来对这些csvs进行子集。我正在尝试在r中设置一个for循环，这样我就可以将函数或计算添加到csvs列表中，以便稍后为ggplot或stat分析生成数据帧。(我目前已经安装了tidyverse、dplyr和ggplot2 )。现在，我只想对csvs进行子集，然后根据子集数据创建一个数据帧。我使用for循环成功地将多个csvs读取到单独的数据帧中，方法是设置一个工作目录，创建一个csvs列表，然后将它们读取到数据帧中。这将当前为以原始文件名命名的每个csv输出一个数据帧： filenames <-

浏览 0提问于2019-02-26得票数 0

2回答

根据dataframe中的字符向量来子集我的R列表

r、list、object、dataframe、subset

我有一个r对象，'d‘，这是一个列表。我想要一个引用这个列表的子集的数据帧，作为函数'myfunction‘的变量。这个函数将使用rslurm被调用数千次，每次调用都使用d的不同子集。示例: d['1'][3]引用列表中的数据矩阵。 myfunction(d[['1']][[3]]) 工作得很好，但我希望能够从数据帧调用这些子集。我希望能够拥有一个包含所有子集引用的dataframe 'ds‘。 >ds d 1 d[['1']][[3]] 2 d[['1']][[4]

浏览 0提问于2018-03-28得票数 0

1回答

r、csv、dataframe、large-files、subset

我一直在研究一种使用R从大型csv数据集中有效地提取信息的方法。许多人似乎都推荐使用包ff。我成功地读取了数据集，但现在尝试将其子集时遇到了问题。最大的数据集包含超过650,000行和1005列。并非所有列都包含相同的数据类型。将其视为数据帧，其结构将如下所示： 'data.frame': 5 obs. of 1005 variables: $ SAMPLING_EVENT_ID : Factor w/ 5 levels "S6230404","S6252242",..: 2 1 3 4 5 $ LATITUDE

浏览 4提问于2012-09-14得票数 0

4回答

是否有使用列中的定性需求对数据进行子集的功能？

r、subset

我在为大型数据帧创建子集时遇到了问题。我需要提取与其中一列中两个正确城市之一匹配的所有行，但是我创建的任何子集最终都是空的。给定主要数据帧，我尝试： New = data[data$Home.port %in% c("ARDGLASS","NEWLYN")] 但是，R返回“选定的未定义列”

浏览 0提问于2020-03-11得票数 0

2回答

如何在不添加"Row.names“列的情况下按行名合并数据帧？

r、merge、dataframe

如果我有两个数据帧，例如： df1 = data.frame(x=1:3,y=1:3,row.names=c('r1','r2','r3')) df2 = data.frame(z=5:7,row.names=c('r5','r6','r7')) ( R> df1 x y r1 1 1 r2 2 2 r3 3 3 R> df2 z r5 5 r6 6 r7 7 )，我想按行名合并它们，保留所有内容(即外部连接或all=T)。这就完成了： merged.df <- me

浏览 1提问于2013-06-29得票数 16

3回答

查找特定选择是否位于数据帧R中

我有一个Data Frame对象，它包含可能的选择列表。例如，这方面的类比如下： FirstName, SurName, Subject, Grade Brian, Smith, History, 75 Jenny, Jackson, English, 60 我怎么会..。 1)检查某一学生-科目组合是否在我的数据框架内。 2)对于那些在那里的人，提取他们的等级(以及其他可能相关的领域)。非常感谢到目前为止，我找到的唯一解决方案包括将值附加到数据帧的末尾，并试图查看它是否是唯一的？这似乎是一次粗野可笑的黑客攻击？

浏览 4提问于2015-09-25得票数 0

回答已采纳

2回答

如何在R中将特定的列表元素解压成数据帧？

r、list、loops、for-loop、lapply

我一直在研究这个问题，并且只找到了将列表元素合并到一个大型数据框架中的解决方案。然而，我正在努力只解包那些满足特定条件的元素。 df1 <- iris %>% filter(Sepal.Length > 2.5) df2 <- mtcars %>% filter(qsec > 16) not_neccessary <- head(diamonds, 10) not_neccessary2 <- head(beaver1, 12) data_lists <- list("#123 DATA" = df1, "CON&

浏览 12提问于2021-02-16得票数 1

回答已采纳

2回答

我有两个由数据帧组成的列表- df_quintile和disease_df_quintile。我不知道如何简洁地表示它们，但这是它们在Rstudio中的样子： ? ? 请注意，disease_df_quintile由5个数据帧(数据帧1到5)组成，而disease_df_quintile由4个数据帧(数据帧2到5)组成。我想交叉检查两个列表，并删除两个列表不共享的任何数据帧-因此，在本例中，我想从df_quintile列表中删除第一个数据帧。我如何才能做到这一点？谢谢。

浏览 28提问于2019-03-05得票数 0

回答已采纳

1回答

按其数据帧的值拆分列表

r、list

假设我们有这些数据(我们只有列表"Acc")： rdate <- function(x,min = paste0(format(Sys.Date(), '%Y'), '-01-01'), max = paste0(format(Sys.Date(), '%Y'), '-12-31'), sort = TRUE) {dates <- sample(seq(as.Date(min), as.Date(max), by = "

浏览 1提问于2018-09-26得票数 0

回答已采纳

5回答

R中的快速子集

r、dataframe

我有一个大小为30000 x 50的数据帧。我还有一个单独的列表，它包含指向此数据帧中的行分组的指针，例如， rows <- list(c("34", "36", "39"), c("45", "46")) 这表示具有行名(不是数字行索引，而是字符行名(Dat)) "34“、"36”、"39“的dataframe行构成一个分组，而"45”、"46“构成另一个分组。现在，我想将分组从数据帧中拉出到一个并行列表中，但是我的代码(如下所示)非常非常慢。我怎么才能加快速度呢？

浏览 0提问于2012-01-20得票数 7

回答已采纳

3回答

按列值从大型pandas数据帧中获取随机样本

python、pandas、csv

我有一个熊猫数据框架，看起来像这样： # Name City 1 John NYC 2 Doe Berlin 3 Jonathan Tokyo 4 Andrew Barcelona 5 Heather London .. ...... ...... .. ...... ...... .. ...... ...... 60000 Summer Madrid 假设我有一个这样的城市列表：

浏览 26提问于2019-10-23得票数 0

2回答

r、list、dataframe

我有一个非常小的csv文件，当我导入到R中时，它会变成一个数据帧。我想使这个数据帧成为一个列表，但是"as.list“只以列表的形式向我读取数据帧条目，并不实际对数据进行更改。我需要使一个属性csv列表，以便使用它来创建一个社区在R。任何建议将不胜感激！

浏览 1提问于2018-05-13得票数 0

2回答

循环if语句遍历各行

我是R的新手，所以我在问一个基本的问题。我有两个数据帧数据帧1包含匹配对： Factor1 Factor2 A D B E C F 数据帧2包含不同样本中不同因素的水平： Sample1 Sample2 A 10 0 B 10 0 C 0 0 D 0 10 E 0 10 F 0 0 我正在尝试遍历第一个数据帧。对于数据帧1中的每一行，如果样本1中factor1的电平大于5，并且样本2中因子2的电平大于5，则在数据帧1中添加第三列中的TRUE，否则添

浏览 0提问于2017-09-12得票数 0

2回答

R循环-拾取下一个输入并将输出存储到数据帧中

r、loops、dataframe

所以我是R的新手，基本上我希望从一个数据帧中获取数据并将输出存储到新的数据帧中的大量回归，但也要创建一个循环来自动“拾取下一个输入”并跳过重复项。我附上了一张我的数据的照片。这是我运行回归的代码 #inputs Airport = "ABZ" #choose target airport & nation GDP df <- subset(Elasticities_Study, Airport_Code==Airport) #log-log df <- data.frame(df$Year, df$Region, df$

浏览 4提问于2017-09-19得票数 1

2回答

没有重复的移除观测

r、dataset、duplicates

我想将数据集分解为两个框架--一个是原始数据集基于条件具有重复观测，另一个是原始数据集没有基于条件的重复观测。在下面的示例中，我想将帧分解为一个只有一个编码器用于观察的帧和一个只有两个编码器的帧： frame <- data.frame(id = c(1,1,1,2,2,3), coder = c("A", "A", "B", "A", "B", "A"), y = c(4,5,4,1,1,2)) frame 为此，我想提出： frame1: id coder y 1 1

浏览 4提问于2014-08-08得票数 1

回答已采纳

1回答

Kable:当尝试以标记方式显示数据框时，“表应具有标题(列名)”

rstudio、markdown、knitr、arules、kable

我正在尝试将我的r markdown文件编织成一个markdown，但是当我使用knitr::kable(df，format = "markdown")来显示一个用arules包中的inspect(rules)创建的数据框时，我得到了以下结果： “列表中的警告(x=结构(kable_markdown(0)，.Dim = c(0L,0L)，.Dimnames = list(：表应具有标题(列名))” 此错误不会在rstudio本身中发生，数据帧将按预期以表的形式输出。到目前为止，我已经能够毫无问题地编织其他不是用arules：：inspect(规则)创建的数据帧，并且一切正常。

浏览 11提问于2019-08-10得票数 0

1回答

在列表中设置多个数据帧的子集，以R中的CD和RESN结尾变量

我有一个包含3个数据帧A、B和C的列表，每个数据帧中有3个变量，分别命名为(ID,ACD,ARESN),(ID,BCD,BRESN)和(ID,CCD,CRESN)。如何在列表中选择以CD和RESN结尾的所有三个数据帧

浏览 1提问于2018-10-25得票数 0

1回答

如何在R中将匹配数据分离为一个数据帧，而将不匹配数据分离为另一个数据帧

r、dataframe

我有下面的数据， R1 <- c("15515","5156",NA,NA, "2857") RC <- c("ACC","ZXC","ACC","QWZ","ACC") R2 <- c(515,5156.11-,415-,1455-,886) df <- data.frame(R1,RC,R2, stringsAsFactors = F) 我有一个条件，R1不应该包含NA，RC只是ACC，它将被捕获到df1中，而剩余的数据将被捕获到另一个数

浏览 12提问于2020-08-26得票数 0

回答已采纳

1回答

如何在R中建立不同数据帧之间的层次簇？

r、cluster-analysis

我有4个不同城市的不同数据帧，但变量相同。我想在for city的数据集之间创建一个层次聚类。我已经尝试了以下代码在R中创建一个层次聚类： hc <- hclust(dist(df)) hcd <- as.dendrogram(hc) 但是这段代码生成了一个数据帧的树状图。我想做的是做一个不同城市之间的树状图，所以我想聚类不同城市之间的行。我在互联网上搜索了很多，我找不到任何关于它的东西。有人知道如何解决这个问题吗？我也尝试过合并数据集，但它也会生成具有相同城市的聚类。我想在不同城市之间进行聚类下面是我的数据集的一个示例：我有4个不同城市的不同数据帧，但变量相同。我想在for

浏览 1提问于2016-05-24得票数 0

1回答

将列表转换为一组数据帧

r、dataframe

我问了一个问题。我在这里提出一个后续问题，因为它可能作为一个独立的问题有用。我有以下最小的示例R代码： Name <- c("John", "Jane", "Arthur", "Maggie","Harry", "Will") Age <- c(20, 30, 31, 33, 30, 20) City <- c("London", "Paris", "New York", "Delhi", "London

浏览 49提问于2018-10-26得票数 0

1回答

如何将变量与R中列(dataframe)中的数字进行比较

我真的很难把这个练习做完。我们应该将数据帧中的向量(R中的数据框架称为“谓词”)与log(5)进行比较，后者为1.609438(动词$LengthOfTheme> 5)。使用for -循环，我只能完成上述列的任务。但是，当我尝试对整个数据帧使用代码时，在最后得到列"LengthOfTheme“仅包含大于5的变量的新数据帧时，就会得到错误的结果。我的代码如下：对于列LengthOfTheme，分别： data(verbs) for (x in verbs$LengthOfTheme) { if (x > 1.609438) { print(x) } } 现在

浏览 2提问于2020-10-03得票数 0

回答已采纳

3回答