在两个条件下专门为每行设置数据帧子集_在某些条件下，数据帧为每行拆分为多个数据帧_以两个日期之间的最小差异为条件设置数据帧子集 - 腾讯云开发者社区

、、

如果我从一个有50个观察值的数据帧中生成一个30个的样本，我如何使用filter函数将剩余的20个从50个数据帧中分离出来？是否可以在两个数据帧之间使用filter函数？如果是这样，那么是如何实现的呢？提前谢谢。

浏览 3提问于2018-12-05得票数 0

1回答

逐行计算数据帧均值

、、

是否有方法从数据帧中计算一行的平均值？例如： df <- data.frame(X = c(1,1,1,1,2,2), Y = c(1,4,4,4,4,3), Z = c(2,5,6,8,3,1)) df X Y Z 1 1 1 2 2 1 4 5 3 1 4 6 4 1 4 8 5 2 4 3 6 2 3 1 那么，我如何计算每行的平均数呢？ mean(df[,1:3]) 我真的不明白为什么这不起作用，我的意思是，同样的代码适用于min()或max()，但不适用于mean()。 min(df[,1:3]) [1] 1

浏览 2提问于2021-03-26得票数 1

回答已采纳

1回答

拆分数据帧并有新的行号

、

当我将数据分割成两个新的数据帧时，两个新数据帧的行号将索引原始数据帧。例如，如果dfA有行号1、2、3、4；我想创建两个基于交替行的新数据帧(因此，行1和3转到dfB，行2和4转到dfC)。但是我希望行号在dfB和dfC中有新的索引，这样实际上dfB和dfC都有1&2作为行索引。这是一个问题，因为当我将我的(实际上要大得多的df)拆分为A和B时，每当我试图访问特定的数据点时，row.names中出现的数字与R读取的实际行号不同。有什么想法吗？

浏览 5提问于2016-03-16得票数 0

回答已采纳

2回答

删除嵌套在列表中的不匹配数据帧名称

我有两个由数据帧组成的列表- df_quintile和disease_df_quintile。我不知道如何简洁地表示它们，但这是它们在Rstudio中的样子： ? ? 请注意，disease_df_quintile由5个数据帧(数据帧1到5)组成，而disease_df_quintile由4个数据帧(数据帧2到5)组成。我想交叉检查两个列表，并删除两个列表不共享的任何数据帧-因此，在本例中，我想从df_quintile列表中删除第一个数据帧。我如何才能做到这一点？谢谢。

浏览 28提问于2019-03-05得票数 0

回答已采纳

2回答

设置多列NA取值范围(仅限于base和car套餐)

、、

如何在R中仅使用base、car和外部包对数据集进行某种形式的批量重新编码？我使用的是一台政府计算机，所以我不能安装任何额外的软件包来简化这项工作。理想情况下，我希望能够为car的重新编码函数提供数据帧，或者将重新编码函数应用于数据帧中的所有/大多数变量。我正在试图弄清楚如何使用apply/lapply函数，但我不知道如何使用它们，也没有太多成功。这个想法看起来像下面这样，尽管这段代码不能工作：对于数据帧“df”中的向量2到92： df<-recode(df[2:92], '98:100=NA) 有什么建议吗？我将不胜感激。

浏览 0提问于2011-08-17得票数 1

回答已采纳

1回答

使用另一个子集的数据using的剩余子集

、、

我有一个样本数据集。我使用一些条件创建了原始数据帧的子集。现在，除了创建的子集之外，我还需要提取原始示例数据框架的其余内容。我该怎么做？ data("mtcars") fulldf <- mtcars subdf <- subset.data.frame(fulldf, subset = fulldf$disp < 100) restdf <- subset.data.frame(fulldf, subset = <fulldf without subdf>) 在R中设置数据帧有很多问题，但我找不到满足我需求的问题。另外，最终的解决方案不一定

浏览 0提问于2019-03-20得票数 1

回答已采纳

1回答

计算R数据帧各列之间的相关性

我有一个大型数据表，其中包含2组4配对的观察值，其中的前几行如下： a1 a2 a3 a4 b1 b2 b3 b4 1 480 770 601 953 469 750 588 944 2 0 0 0 0 0 0 0 0 3 3 13 9 12 3 12 9 12 4 0 2 4 3 0 14 3 2 5 0 0 11 0 0 0 11 0 6 165 292 162 313 180 368 116 368 这些是来自两个不同的RNA-seq分析管道'a‘

浏览 0提问于2017-07-18得票数 0

回答已采纳

1回答

对anova摘要的名称数据框架

、

很抱歉，如果这已经得到了回答，但我发现很难得到答案，我的R问题！我的问题是如何以一种有用的方式存储多个anovas的结果。我正在使用'aov‘对数据帧的子集执行anovas，一次比较两个数据帧，使用以下功能： doAnova = function(first, second) { aov(number ~ factor1+factor2, data=rbind(first, second)) } 这是用来比较每一个子集与一个“基本”案例，以检查显着性差异。为了在多个数据集上执行此操作，我在一个循环中使用它： for (name in names) { result

浏览 1提问于2012-03-08得票数 0

回答已采纳

1回答

R中两个数据帧之间的统计运算

、、

我有两个大的数据帧，一个是模拟数据，另一个是观测数据。列表示要比较的点，行表示小时数。 dim(SIM) [1] 400 1000 dim(OBS) [1] 400 1000 400是小时数，1000是我想要比较的点。观测数据帧也包含大量的NA值。因此，当我尝试在两个数据帧上应用该函数时： BIAS <- function(x, y) { x <- na.omit(x) y <- na.omit(y) res <- mean(x - y) } NA值从观测数据帧中删除，该数据帧最后为空，因为每行至少有一个NA。我如何重新定义它，以便执行

浏览 0提问于2013-06-24得票数 1

回答已采纳

1回答

用另一个data.frame中的列表减去data.frame中的列表

、、

我有两个数据框，每行显示一个月和一个in列表。它们看起来像这样：数据帧A： Month ID 2016-03 1,2,3 2016-04 4,5,6 2016-05 7,8,9 数据帧B： Month ID 2016-03 2,3,4 2016-04 5,6,7 2016-05 8,9,10 看起来很简单，也许我想得太多了，但我在从dataframe A减去dataframe B中的相应行时遇到了麻烦。最终目标是在删除dataframe B之后，从dataframe A中获取每行的is计数。因此，生成的数据帧将如下所示： Month ID 2016-03 1 2016-0

浏览 10提问于2016-07-26得票数 0

回答已采纳

1回答

Python Pandas -如何将两个数据帧(具有相同维度)的不相交内容合并为单个数据帧

、、、

我有两个数据帧，它们具有相同的形状(相同的索引和列名)，并且都是稀疏填充的。保证两个数据帧中填充的信元是不相交的，例如填充df1中的信元A1，则保证df2中对应的信元不相交。我想将这两个数据帧的内容合并到一个数据帧中--有什么建议吗？下面是一个玩具示例：给定这两个输入数据帧： df1 = pd.DataFrame(index = [0,1,2,3]) df2 = pd.DataFrame(index = [0,1,2,3]) df1['Fruit'] = ['Apple','','Orange',''] d

浏览 23提问于2021-02-03得票数 0

回答已采纳

2回答

在R中的两个DataFrames的多个列上使用Difftime函数

、

我有两个数据帧，每个都包含时间戳列，如下图所示：数据帧-1：数据帧-2：我想找出数据帧的每一列之间的时间差，例如: DF1的Column1的各行和DF2的Column1的各行之间的时间差。我只提到了上图中每个数据框中的三列，尽管我在原始数据集中的每列中都有257列，但我目前正在使用以下命令逐个找出差异： diff_time_1<- difftime(df1$t1,df2$l1) diff_time_2<- difftime(df1$t2,df2$l2)..so on 如果我尝试对所有257列执行操作，这将花费大量的精力，我已经尝试了使用apply函数和f

浏览 11提问于2017-07-31得票数 1

回答已采纳

1回答

如何在价值周围创建区域？

对不起，可能我的问题不是很清楚，因为我不能表达它。我将用例子来解释。我有两个数据帧df和df1 df <- data.frame(a = c(25,15,35,45,2)) df1 <- data.frame(b = c(28,25,24,43,10)) 我想用ConditionIf值== +-5和create column distance合并两个数据帧。例如，列a中的第一个元素是25，我希望将25与列b中的所有元素进行比较，并且只希望选择25 == +- 25。输出应如下所示： a b distance 25 28 3

浏览 1提问于2021-08-25得票数 1

回答已采纳

4回答

是否有使用列中的定性需求对数据进行子集的功能？

、

我在为大型数据帧创建子集时遇到了问题。我需要提取与其中一列中两个正确城市之一匹配的所有行，但是我创建的任何子集最终都是空的。给定主要数据帧，我尝试： New = data[data$Home.port %in% c("ARDGLASS","NEWLYN")] 但是，R返回“选定的未定义列”

浏览 0提问于2020-03-11得票数 0

2回答

如何按列值在数据帧列表中选择行

我有一个包含四个数据帧的列表(Lfs01)，每个数据帧都有不同数量的列和行。我想通过一列中的值(如果是== 1)过滤所有数据帧中的行。变量在前两个数据帧中称为"a“，在最后两个数据帧中称为"A”。我以前看过类似的问题，但不幸的是，我没有找到解决办法。以下是我尝试过的一些事情： data<-lapply(lfs01, function(x) filter(x ,'a'==1)) data<-lapply(lfs01, function(x) filter(x ,'a'==1|'A' ==1)) 结果:列出4个0行

浏览 3提问于2019-12-01得票数 1

回答已采纳

1回答

在R中按列选择元素

我需要使用存储在向量中的行索引来选择数据帧的元素。换句话说，我有一个向量或长度等于数据帧中的列数，该向量包含我需要提取的元素的行号(按顺序，每列一个元素)。我该怎么做呢？示例： vec <- c(1,2,1) df <- data.frame(matrix(1:6, ncol = 3, nrow = 2)) 它看起来像这样： X1 X2 X3 1 1 3 5 2 2 4 6 我需要使用来自vec = 1,2,1的索引来获取元素(1，4，5

浏览 8提问于2020-05-20得票数 1

回答已采纳

1回答

基于此数据框架在一个数据框架中选择行

、

我有两个熊猫数据帧。我希望根据每个记录中的字段是否高于此数据帧中的值，以及同一字段是否低于另一组中的值，在一个数据帧中选择一个记录子集。以下是第一个数据帧中值超过截止值的所有记录： roi_upregulated_genes = roi[roi['zscore']>CUTOFF] 如何在df_two中找到相应的zscore。两个数据帧具有相同的列名。逻辑就像 roi_selectively_upregulated_genes = [gene for gene in roi_upregulated_genes if control[gene][zscore] <

浏览 4提问于2015-02-09得票数 0

回答已采纳

1回答

无法访问df.set_index之后的列

、

你好，在我的数据帧的一列上设置了索引后，我想提取属于这一列的数据，但是python显示了这个错误KeyError：'airline‘。airline是question.thnx上帮助我的专栏的标题这是为了可视化我的数据帧 df_air.set_index('airline',inplace=True) print(df_air.loc['Royal Air Maroc']) subDf = df_air[df_air['airline'].isin(['Egyptair', 'Royal Air Maroc&

浏览 5提问于2019-08-27得票数 0

回答已采纳

2回答

没有重复的移除观测

、、

我想将数据集分解为两个框架--一个是原始数据集基于条件具有重复观测，另一个是原始数据集没有基于条件的重复观测。在下面的示例中，我想将帧分解为一个只有一个编码器用于观察的帧和一个只有两个编码器的帧： frame <- data.frame(id = c(1,1,1,2,2,3), coder = c("A", "A", "B", "A", "B", "A"), y = c(4,5,4,1,1,2)) frame 为此，我想提出： frame1: id coder y 1 1

浏览 4提问于2014-08-08得票数 1

回答已采纳

1回答

基于行和列条件跨多个CSV文件计算平均值，并删除NA数据

、、、、

我正在处理300多个csv文件中的数据。每个csv文件中的变量列名都是相同的。我使用rbind和loop将列堆叠到一个空的数据框中。我想计算一列的平均值，但在此之前，我需要(1)根据另一列中的值对数据框进行子集或隔离。示例：考虑名为dfABC( )的以下数据帧 A B C 1 5 7 1 4 6 4 5 8 2 5 7 2 1 7 3 2 3 我需要根据列中的值缩小数据框。假设我想要根据B列缩小数据帧。假设我想返回B= 5的所有行。然后我会得到这个数据帧： A B

浏览 0提问于2015-02-14得票数 1

1回答

如何根据条件从另一个数据框中删除数据框

我目前正在处理一个2个数据帧，一个我简单地称之为Data，另一个称为DataOutput。Data有21个变量的400,000多个观测值，而DataOutput只有21个变量的4个观测值。DataOutput是一个数据框架，它包括不同和的简单多少NA和OOR(OutofRange)以及#测量和比率((NA+OOR)/#Measurements)。Data dataframe当前包含大量只包含NA的列，因为根本没有这些变量的测量值。我想去掉那些只有NA的列。 for(z in 2:22) { if(DataOutput[4,z] == 1) //This is the ratio ((NA+

浏览 2提问于2012-06-27得票数 1

1回答

Javascript:框架之间的通信

、、

我有两个不同的应用程序加载到不同的框架中。我需要它们进行通信我知道javascript安全模型不允许从不同域加载的帧进行通信，但是由于我控制着这两个应用程序，也许有一种方法可以允许从特定另一个域加载的帧与这个帧进行通信。如果不可能，那是怎么回事呢？

浏览 0提问于2010-10-29得票数 0

1回答

将NA添加到替换的特定部分

我正在处理两个向量和一个数据帧： x <- c("A", "B", "D") y <- c(1, 3, 5) df: # var1 var2 #1 ddAd NA #2 dBdd NA #3 ddCd NA #4 Dddd NA 我想要的结果是： df: # var1 var2 #1 ddAd 1 #2 dBdd 3 #3 ddCd NA #4 Dddd 5 有人建议使用以下方法： z <- grep(paste(x, collapse="|"), df$var1, value = FA

浏览 1提问于2016-09-22得票数 2

回答已采纳

1回答

R-查找一个数据框中的位置值可以在另一个数据框中找到

我有两个不同长度的数据帧。使用下面的函数，我已经提取了每个副本，包括原始副本和出现两次以上的副本。 duplikat_n=matxt[(duplicated(matxt) | duplicated(matxt, fromLast = TRUE)), ] 现在我想找出在df matxt中的哪个点有副本。 which(c(matxt==duplikat_n)) 下面的函数给了我一个错误： ‘==’ only defined for equally-sized data frames 那么，我如何检查我的副本在数据帧矩阵中的哪个位置呢？示例： s <- data.frame(Y = samp

浏览 7提问于2018-01-11得票数 0

1回答

“subset”的奇怪问题

、

我对subset有一个奇怪的问题:它不能识别我数据帧中的变量。例如，如果我想要数据帧DF中变量v1的摘要，我会得到： summary(DF$v1) Min. 1st Qu. Median Mean 3rd Qu. Max -123.00 4.00 14.00 84.62 49.00 13140.00 现在，这个变量应该总是非负的，所以我想通过将dataframe DF子集到dataframe PROBS中来检查负值。但如果我试着这样做： PROB <- subset[DF, v1 < 0] 我得到了： Error: object "v1

浏览 3提问于2012-11-27得票数 3

回答已采纳

1回答

在python中从一个pandas dataframe生成每个列的组合

、、、

我想用一个数据帧来可视化每一列在k邻居分析中有多有用，所以我想知道是否有一种方法可以循环删除列并分析数据帧，以便为每一个单独的列组合产生准确性。我真的不确定pandas中是否有一些我不知道的函数可以让这件事变得更容易，或者如何循环通过数据帧来生成原始数据帧的每一个组合。如果我没有很好地解释它，我会尝试创建一个图表。 A|b|c||标签 1|2|3||0| 5|6|7||1 上面的数据帧在通过splitting和k-neighbors函数运行后会产生类似下面这样的结果： A&b= 43% A&C= 56% B&C= 78% A&B&C= 95%

浏览 3提问于2018-01-30得票数 0

回答已采纳

1回答

基于R中名称向量的数据帧中冒号的设置

、

我有一个数据帧output，具有563 (y)变量的dim()特性和2947个观测值(x)。列1-2是主题#s和测试标签，而3-563是变量观察的名称。我有一个单独的数据框架df-vars，包含561个变量名。如果使用output，如何将原始数据帧df-vars的列名设置为561变量名 df-vars看起来是这样的： V1 V2 1 1 tBodyAcc-mean()-X 2 2 tBodyAcc-mean()-Y 3 3 tBodyAcc-mean()-Z 4 4 tBodyAcc-std()-X 5 5 tBodyAcc-std()-Y

浏览 3提问于2015-05-01得票数 1

回答已采纳

1回答

根据R中的列名创建一个新数据框，其中包含来自另一个数据框的列

、、

数据帧A存在。我想创建数据帧B，并在数据帧B中插入数据帧A中的某些列。我不想使用列号，而是使用列名。非常感谢！

浏览 7提问于2019-12-12得票数 2

回答已采纳

1回答

Qt中具有单一模型的表视图和列表视图

、、

我有一个2D模型，其中每行表示视频中的一帧，每列表示一个对象。对象可以在每个帧上具有不同的状态，这存储在模型中。然后我有一个QTableView来显示这些数据。该模型具有标头数据，因此每行都有一个类似"frame k“的标头，每列都有一个类似"object n”的标头。此表是可编辑的。但我希望用户以另一种方式编辑它。另一种方式是显示单个帧的图形视图。图形视图下方是表示每个帧的列表(水平方向)。这样，用户可以单击列表中的框架，图形视图现在将显示该框架。问题是该列表显示模型中每行的第一列。我想要它做的是显示每一行的标题(所以列表显示“帧1，帧2，等等”)。有没有办法做到这一点？

浏览 3提问于2008-09-19得票数 1

回答已采纳

2回答

如何获取每行变量的总数

我有一个类似于下面名称sp的数据帧 Join p1 sp1 p2 sp2 p3 sp3 1 0 0 0 0 0 0 2 1 pine 0 0 1 Aspen 3 2 pine 0 0 0 0 数据帧继续显示100行，其中p1是由列sp1指示的物种数量，依此

浏览 1提问于2018-06-01得票数 2

1回答

排除在不同列中具有相同值的行

、、

我有一个包含10列的数据帧： A B C 1 1 1 1 1 1 1 B M J 2 1 2 2 2 2 2 J K Z 3 3 3 3 3 3 3.1 V N I 4 4 4 4 4 4 4 我想排除那些在4到10列之间具有相同值的行。我找到了比较不同行的解决方案，但这里我讨论的是1行以内的行。所以输出是 B M J 2 1 2 2 2 2 2 J K Z 3 3 3 3 3 3 3.1 因为第一行和最后一行在第4列到第10列中具有相同的值。我可以通过将每个值1

浏览 1提问于2012-09-18得票数 0

回答已采纳

1回答

pandas:如何针对other列中的每个组，在一列中的'true‘值之前设置具有'False’值的行子集

、、

我想问一下关于数据框子设置的问题假设我有像这样的数据帧 |index |name|buy| -------------- 0 a False 1 a True 2 b False 3 c True 4 b False 5 a False 6 c True 7 c False 问题是如何针对其他列(在本例中为name列)中的每个组，将列(在本例中为buy列)中的False值在true值之前的行设置为子集所要求的结果是这样的 |index |name|buy| -------------- 0 a False

浏览 1提问于2017-02-14得票数 0

1回答

使用R过滤基于另一个数值向量的多个数值列

我有一个包含2个数字列的大型数据帧(具有重复的数字)。我需要使用另一个数字向量中的值过滤这两个列，并在这两个列中创建一个具有匹配条目的新数据帧。例如：Dataframe df有两列A和B： A . B 1 . 2 1 . 3 5 . 7 8 . 7 7 . 1 然后，我有一个向量ind=c(1,2,5,7) 所需的输出将是仅包含以下行的新数据帧： A . B 1 . 2 5 . 7 7 . 1 注意:只保留A和B的值都与向量值匹配的那些行。

浏览 0提问于2018-11-04得票数 0

2回答

如何比较两个数据帧？

、

我有两个数据帧，每个数据帧都有两列(例如x和y)。我需要比较两个数据帧，看看x或y中是否有任何值，或者x和y在两个数据帧中是否都相似。

浏览 3提问于2012-06-11得票数 8

回答已采纳

1回答

删除各行中的重复值

、

我想删除在所有列中具有相同值的行。例如，我有一个家庭和工作ID。如果某一行的家庭和工作地点ID相同，我想删除整行。示例如下： Home Work 4532 4532 3433 3434 2343 2343 例如，我想删除第一行和第三行，因为它们的每一列具有相同的值。但我想知道如何对所有行执行此操作，这适用于相当大的数据集。

浏览 4提问于2018-12-24得票数 0

1回答

r:操作数据，使具有相同值的列以特定方式组合

、

我有一个数据帧，其中每一列都由0和另一个数字组成。例如： ? 我想要操作数据帧，以便包含相同其他数字的列成为一列，其中如果另一个数字出现在每行中，则该值与另一个数字相同，否则它将变为零。例如，我希望上面的数据帧看起来像这样 ..1 ..2 ..3 1 2 3 0 2 0 0 0 0 1 0 0 数据帧的第一行是1，因为原始数据帧的第一行中的值都是1。第一列的第二行是0，因为该行中有1和0。以下是一些可重现的数据： structure(list(...1 = c(1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0,

浏览 9提问于2021-01-20得票数 0

回答已采纳

3回答

根据R中另一个DataFrame上的条件从DataFrame中提取值

、、、、

我有以下两个示例数据帧： df1 <- data.frame(EVI_GT=c(0.23, 0.54, 0.36, 0.92), EVI_GNT=c(0.33, 0.65, 0.42, 0.73), EVI_GGT=c(0.43, 0.34, 0.22, 0.98)) df2 <- data.frame(T_ET_GT=c(0.56, 0.23, 0.95, 0.82), T_ET_GNT=c(0.10, 0.74, 0.36, 0.35), T_ET_GGT=c(0.52, 0.31, 0.65, 0.58)) 我必须从df2中提取与df1的最小和最大值对应的值(每行)。例如，

浏览 57提问于2021-03-22得票数 3

回答已采纳

2回答

有没有一个“函数”可以得到两个DataFrames的补码？就像pd.merge的反面--内部

、

我正在尝试根据列属性获取两个数据帧的补码。 pd.merge可以接受交叉点，但有没有一种简单的方法可以在不创建/洗牌更多数据帧的情况下接受称赞？其他人在这里回答了这个问题(how to find the complement of two dataframes)，提出了一种创建/混洗更多数据帧的方法，但我想知道是否有更直接的方法来使用函数来做到这一点。

浏览 24提问于2019-01-24得票数 0

回答已采纳

3回答

如何将一个数据帧中的整个列替换为另一个数据帧中的另一列？

、

我有两个数据帧。我想将dataframe1中的ids替换为通用ids。在dataframe2中，我已经将来自dataframe1的In与通用In进行了映射。我是否必须合并这两个数据帧，并在合并后删除不需要的列？谢谢。

浏览 30提问于2020-03-25得票数 1

回答已采纳

1回答

按下按钮时清除UITableView单元格中的UITextField文本

、、、、

我有一个包含两行的表视图，每行都有一个文本字段。一个文本字段用于用户名，另一个用于密码。当我单击一个按钮时，我想要清除这两个字段，并用初始占位符替换内容。我试过[mytableview reloadData];了。这只会重新加载表视图；文本字段不会被清除。占位符出现在编辑文本字段时输入的文本上，下次我尝试编辑文本字段时，文本将绘制在第一个文本上。

浏览 0提问于2011-05-20得票数 0

回答已采纳

2回答

循环if语句遍历各行

我是R的新手，所以我在问一个基本的问题。我有两个数据帧数据帧1包含匹配对： Factor1 Factor2 A D B E C F 数据帧2包含不同样本中不同因素的水平： Sample1 Sample2 A 10 0 B 10 0 C 0 0 D 0 10 E 0 10 F 0 0 我正在尝试遍历第一个数据帧。对于数据帧1中的每一行，如果样本1中factor1的电平大于5，并且样本2中因子2的电平大于5，则在数据帧1中添加第三列中的TRUE，否则添

浏览 0提问于2017-09-12得票数 0

1回答

启动如何仅在分区内连接

、、

我有两个大数据帧。每一行都有lat/lon数据。我的目标是在两个数据流之间做一个连接，找出所有在一定距离内的点，例如100米。 df1: (id, lat, lon, geohash7) df2: (id, lat, lon, geohash7) 我想在df1和df2上对geohash7进行分区，然后只在分区中加入。我希望避免在分区之间加入以减少计算。 df1 = df1.repartition(200, "geohash7") df2 = df2.repartition(200, "geohash7") df_merged = df1.join(df2, (

浏览 2提问于2020-10-02得票数 0

1回答

如何将数据子集到周围的行中

、、

我有一个包含两列的数据框： dd <- read.table(text = " 344 0 350 16 366 11 376 8 380 28 397 55 398 45 400 19 402 30 408 20 415 0 ") 我希望将第二列中最高值(55)附近的两个最小局部之间的数据设置为子集。结果将是： 376 8 380 28 397 55 398 45 400 19 它必须包含最小局部函数，因为子数据帧的维度是可变的 dd <- read.table(text = " 460 0

浏览 2提问于2018-04-28得票数 0

1回答

如何在计算每一行的分位数后选择行？

、、、、

我有一个包含数值(12579行和21列)的大型数据框架，我想从其中提取适合每行的第一个和第四个四分位数的列(每行都有独立的值)。这就是为什么我要计算每一行的分位数，以便逐行获得两个分位数。 library(matrixStats) d_q1 <- rowQuantiles(delta, probs = c(0.25, 0.75)) delta2 <- as.data.frame(cbind(delta,d_q1)) dim(delta2) # 12579 23 library(dplyr) delta2 <- filter(delta2, delta2[,1:21

浏览 0提问于2019-08-16得票数 0

4回答

识别两个数据帧中相同的列，并在r中提取它们。

、

我有两个数据帧：mRNA ()和RPPA()。mRNA数据帧有1,212列，而RPPA数据帧有937列。RPPA数据框架中的所有列名称也显示在mRNA数据框架中(但顺序不同)。在列中，两个数据帧之间的值是不同的。我希望创建一个new mRNA数据框架，它将包含与RPPA数据框架相同的列，而将不包含没有出现在(“旧”) mRNA数据框架中的列。举个例子： mRNA <- data.frame(A=c(25,76,23,45), B=c(56,89,12,452), C=c(45,456,243,5), D=c(13,65,23,16), E=c(17:20), F=c(256,34,0

浏览 6提问于2017-01-15得票数 1

2回答

合并两个DataFrames匹配的行/列

、、、

给定两个不同维度的数据帧，我如何将一个数据帧合并到另一个数据帧之上，保持较大的df的维度，并在需要的地方插入较小的数据帧。 x = matrix(data = 1:4, nrow = 20, ncol = 22) y = matrix(data = NA, nrow = 26, ncol = 26) 类似这样的东西，其中Y是一个全空矩阵，X是一个实际数据点的矩阵。我如何合并它们，以便将来自X的数据覆盖到Y的矩阵上我试过像这样的东西 Z<- merge(Y, X, by = "Country", all.x= TRUE) 但最终发生的是，我得到的DF是列大小的两倍，数据

浏览 13提问于2021-05-27得票数 0

回答已采纳

1回答

仅缩放某些列R

、

如何仅缩放(X)数据帧的某些列？我有一个有7列的数据帧，我只想缩放第3列和第6列，其余的应该保持原样。

浏览 0提问于2018-04-19得票数 6

回答已采纳

1回答

从r中的2个数据文件中删除不常见的列

这是我第一次发帖子，我对R是新手，所以请帮助我:) 问题我有两个数据帧。两个数据帧中都存在一些列，但只有一个数据帧中存在一些列。我希望识别和保留这两个数据帧中的列，并删除任何一个数据帧中的列。我该怎么做？ > df1 <- data.frame(a=c(1,2,3,4,5),b=c(2,4,6,8,10),c=c(3,6,9,12,15),x=c(4,8,12,16,20),y=c(5,10,15,20,25)) > df2 <- data.frame(b=c(1,5,10),c=c(2,6,11),y=c(3,7,12),z=c(4,8,13)) > view

浏览 4提问于2015-10-12得票数 2

回答已采纳

1回答

尝试通过查找空行将tsv文件一分为二

、

我正在尝试使用pandas来拆分一个类似如下的tsv文件： X y X y 空行 X y z a b c X y z a b c 分成两个单独的数据帧，一个包含空行之前的一半，另一个包含文件的其余部分-这是因为我不能将整个文件读取到一个数据帧中，因为这两个部分的列数不同。有没有办法建立空行作为第一个数据帧的“停止点”，并将tsv文件的其余部分读取到另一个数据帧中？目前，我只是通过使用pd.read_csv(file_name，skiprows = 3，delimiter = '\t')跳过行来解决这个问题，但是使用这种方法不是一个很好的方法。谢谢!

浏览 8提问于2019-12-11得票数 0

1回答

两个数据框列之间的百分比差异(仅数字)

、、

我有两个数据帧(df1和df2)，只想减去两个数据帧[(df2-df1)/df2]之间的数值列，并确定百分比差异，并使用R创建输出dataframe = df3。非数值列将被保留。 df1和df2具有相同的结构和相同的列名。 df1： colA colB colC ... colZ mean 10 20 stringA count 30 50 stringB df2： colA colB colC ... colZ mean 5 25 stringA count 60 50 stringB df3： colA c

浏览 2提问于2018-08-25得票数 0

回答已采纳