按列查找两个数据帧之间的差异不起作用_查找两个数据帧之间的差异_查找R中两个数据帧之间的差异 - 腾讯云开发者社区

数据包含多列和3000行相同的OrderNo但不同的Ordertype。我想要得到两个数据帧中Ordertype不同的所有OrderNo。我已经从两个数据帧中分离出两列，并将它们设置为升序。然后，我尝试使用函数cbind来组合这两列，并查找其中一列中缺少的值。 xxx <- data.frame( orderNo = c(1:10), Ordertype = c("a", "b", "c", "d", "a", "b", "c", "d", "e

浏览 10提问于2019-09-30得票数 0

回答已采纳

1回答

如何使用R计算同一数据帧中具有相同列名的列之间的差异

首先，我有两个数据帧，我使用公共列删除列的后缀来组合具有相同列但不同后缀的数据帧。现在，我必须计算R中数据帧中具有相同列名的每两列之间的差异我尝试获取唯一的列列名，并将其减去列名，但公共Id列转换为NA。 ffsub[[k]][[i-1]] <- sapply(unique(names(temp)), function(x) apply(temp[grep(x, names(temp))], 1, function(y) { y[1] - y[2] })) 也尝试过； ffsub[[k]][[i-1]] <- sappl

浏览 2提问于2019-05-02得票数 0

2回答

从2个数据帧中查找列的差异

我有两个数据帧 DataFrame A和数据帧B。 A <- data.frame(a=c(1,2,3,4,5),b=c(2,4,6,8,10),c=c(3,6,9,12,15),x=c(4,8,12,16,20),y=c(5,10,15,20,25)) B <- data.frame(a=c(1,2,3,4,5),b=c(2,4,6,8,10),c=c(3,6,9,12,15),x=c(4,8,12,16,20),y=c(5,10,15,20,25)) A a b c x y 1 2 3 4

浏览 2提问于2017-08-23得票数 0

1回答

如何按R中的第n列对数据帧进行排序

我有两个具有相同列数的数据帧。我正在编写一个函数，该函数将两个数据帧和一个整数n作为参数，并需要根据每个数据集各自的第n列对其进行排序。从本质上讲，我如何在不知道列的标签的情况下按第n列对数据帧进行排序？

浏览 0提问于2012-06-17得票数 2

回答已采纳

1回答

逐行追加Pandas数据帧

python、pandas、dataframe

我已经检查了，它应该可以完成这项工作，但由于某些原因，我不能确定逐行追加不起作用。我有两个大小为(x，y)的数据帧。我想按行组合这两个数据帧，因此最终的数据帧大小为(2x，y)。我尝试做了以下几件事： frame_combined = frame_1.append(frame_2, ignore_header=True) frame_combined = pd.concat([frame_1, frame_2], axis=1) # also axis=0 编辑:这样做会得到一个(2x,2y)数据帧。而且我的数据帧也没有报头。如果我得到的数据帧是按行和按列追加的，那么我错过了什么？我如何

浏览 3提问于2018-06-06得票数 2

回答已采纳

2回答

是否删除两个独立数据帧(R)共有的坐标对？

r、pattern-matching、coordinates

我正在尝试从nodes数据帧中删除两个不同数据帧(nodes和poly)共有的坐标。下面的代码在坐标按元素排列时有效，但在其他情况下不起作用。 v1 <- c(2, 2, 4) v2 <- c(9, 2, 7) nodes <- data.frame(v1, v2) v3 <- c(4, 1, 2) v4 <- c(3, 2, 2) poly <- data.frame(v3, v4) newnodes <- nodes[-which(nodes[,1:2] == poly[,1:2]), ] 我如何才能做到这一点？nodes的期望输出为： v

浏览 1提问于2019-02-01得票数 0

2回答

如何比较scala中两个不同的dataframe和print列

scala、apache-spark、apache-spark-sql、compare

这里有两个数据帧：预期的数据帧： +------+---------+--------+----------+-------+--------+ |emp_id| emp_city|emp_name| emp_phone|emp_sal|emp_site| +------+---------+--------+----------+-------+--------+ | 3| Chennai| rahman|9848022330| 45000|SanRamon| | 1|Hyderabad| ram|9848022338| 50000| SF| |

浏览 0提问于2017-06-03得票数 21

回答已采纳

1回答

Pandas按列值将数据帧拆分为两个数据帧-不使用GroupBy

python-3.x、pandas

我想根据列值将我的Pandas数据帧按行拆分为两个数据帧。对于可以按列值对行进行分组的情况，有许多问题和答案。但是，在我的示例中，我希望在特定列中具有唯一字符串的行上拆分我的数据帧。我的计划是获取具有唯一列值的行的行索引，如下所示： split_row_index = df[df['column name']=='unique string'].index.item() 然后使用获得的行索引，将数据帧拆分为两个数据帧，如下所示： df_1 = df.iloc[:split_row_index ] df_2 = df.iloc[split_row_inde

浏览 12提问于2020-08-26得票数 0

回答已采纳

1回答

合并数据框，突出显示有问题的列

python、python-3.x、pandas

我正在尝试合并两个数据帧，目的是找到导致合并错误的值。大多数列在两个数据帧之间不是通用的。下面突出显示了哪些行具有"NaN“值，那么我如何才能找到导致合并问题的列？谢谢 df3 = pd.merge(df1, df2, how='outer') df4 = (df3[df3.isnull().any(axis=1)])

浏览 24提问于2019-05-02得票数 0

回答已采纳

1回答

pandas数据帧维恩图

python、pandas

我有3个数据帧，对于一个练习，我必须将它们连接在一起，并获得基于国家/地区列的公共行 ? 然而，对于这个新练习，我必须获得连接(中间)之外的所有内容的长度。我有这样的代码： ScimEn = pd.read_excel('assets/scimagojr-3.xlsx') ScimEn.set_index('Country') print(ScimEn) #ScimEn = ScimEn.sort_values(by=['Rank']).head(15) merged_df = pd.mer

浏览 12提问于2021-02-09得票数 0

1回答

执行datediff时SQL中的错误

date、type-conversion

当尝试执行datediff以获得两个日期列之间的天数时，我将在server 2012中得到以下错误。我正在尝试下面的内容，createdts是varchar，我已经将今天的日期转换为在varchar中显示日期。为什么它仍然不起作用？ DATEDIFF(day, Load_Confirmed.createdts, CONVERT (varchar, GETDATE(), 104)) 错误-从字符串转换日期和/或时间时，转换失败谢谢

浏览 4提问于2017-09-19得票数 0

1回答

用python、pandas实现股票数据的存储和计算

python、pandas

我正在处理每天使用文件下载的股票数据。该文件每天包含相同数量的列，但行数每天都会发生变化，这取决于进出列表的股票。我希望比较两个日期的文件，并找到之间的总数量列的差异。我想看看这两个文件之间的区别，哪些股票进入了列表，哪些股票退出了列表。我尝试使用pandas数据帧并将其存储在hd5文件中。然后尝试数据帧的合并功能，找出两个文件之间的差异。我正在寻找一个非常优雅的解决方案，以便我可以比较数据帧并找到差异，就像我使用excel的索引和匹配(或vlookup)函数所做的那样。

浏览 3提问于2019-04-18得票数 0

2回答

根据列名名值在pandas中设置dataframe子集

python、pandas、dataframe

我在熊猫中有一个数据帧，我需要拆分。它比这个大得多，但这里有一个示例： ID A B a 0 0 b 1 1 c 2 2 我有一个列表：keep_list = ['ID','A']和另一个列表：recode_list = ['ID','B'] 我希望按列标题将数据帧拆分为两个数据帧:一个数据帧包含列标题与keep_list匹配的列和值，另一个数据帧包含与recode_alleles列表匹配的列标题和数据。到目前为止，我尝试过的每个代码都不起作用，因为它试图将值与列表进行比较，而不是与列名进行比较。非

浏览 18提问于2020-04-30得票数 2

回答已采纳

1回答

在运动补偿技术中，发送者是否可以只发送有关运动的信息？

video、compression、frame、video-processing、motion

我在学习视频压缩时遇到了运动补偿技术。在学习材料中，我用图片进行了解释，但有一些部分我不太了解。 📷 当左侧帧为f0，右侧帧为f1时，两个帧之间的差异是篮球和新出现的手套的位置。可以通过仅发送关于两个帧(f1-f0)之间的差的数据和特定对象的运动信息来减少传输数据。此外，还写道，对于未出现在前一帧中的新部分，例如手套，最好不使用帧之间的差异而按原样发送数据。但在这里，我不知道为什么需要f1-f0的数据，如果接收器有帧f0。难道我们不能只发送篮球运动信息的数据和新出现的手套的数据吗？我不知道为什么两个框架之间的差异是必要的。如果在第f1帧中只有篮球在没有手套的情况下移动，那么是否可

浏览 15提问于2021-10-07得票数 0

回答已采纳

1回答

如何按可变列数对数据进行排序？

r、sorting、dataframe

我想按可变列数对数据帧进行排序。例如，在下面的数据框架中，我想按"x“列排序，然后按”y“列排序： df <- data.frame(x = c("A", "D", "A", "C", "D"), y = c(8, 3, 9, 9, 8), z = c(1, 1, 1, 2, 1)) 我不能指定以下列： library(dplyr) arrange(df,x,y) 因为我的代码必须能够按可变列数(对于此数据帧: 1、2或3列)对数据帧进行排序。我尝试了以下几点： columnsOrder

浏览 0提问于2018-10-03得票数 3

回答已采纳

2回答

比较两个数据帧中的列名

python、pyspark、spark-dataframe

浏览 8提问于2017-03-09得票数 2

回答已采纳

1回答

计算R中数据帧中每一对可能的列的所有行数之间的绝对差

r、vectorization

我想计算数据帧中每一对可能的列的每行数之间的绝对差异。例如，使用下面的dataframe： x <- rnorm(1:10) y <- rnorm(1:10) z <- rnorm(1:10) df <- as.data.frame(cbind(x,y,z)) 有可能的列组合的x-y，x-z，和y-z。我希望计算每一列对在每一行中的数字的差异。我想要的输出是这样的： Variable 1 Variable 2 Difference x y 1 x y 2 x y 3 x z 4 x z 5 x z 6 x z

浏览 3提问于2017-04-28得票数 2

回答已采纳

2回答

如何计算列名模式相似的不同数据框中的列之间的差异？

r、dataframe

我想计算两个数据帧中的列之间的差异。数据帧具有不同的总列数，并且数据帧之间的列名具有相似的模式。我想计算命名相似的列之间的差异。我希望得到一些关于如何开始考虑如何在R或一些示例代码中执行此代码的提示。以下是数据框外观的示例： DF1 w_H_11_XA w_H_13_XA w_H_16_XA w_13_03_XA w_13_12_XA 10 12 1 8 12 11 11 8 6 19 DF2

浏览 12提问于2019-08-21得票数 0

回答已采纳

2回答

如何从spark中的两个数据帧中获取不匹配的列

python、apache-spark、pyspark

我有两个数据帧df1和df2，我只想在结果中不匹配的列。我试着使用SQL来做，但是SQL返回所有列，而不是一列。 df1 col1|col2|col3 a b c 1 2 3 df2 col1|col2|col3 a b e 1 2 3 我想要的是如果它能返回 df3 col3 是否可以在pyspark中做do，或者我必须通过从两个数据帧中选择每一列然后进行比较来进行比较？

浏览 5提问于2018-08-20得票数 0

1回答

无法比较数据集

pandas、machine-learning、data-science

我无法比较两个不同数据帧的列值。第一个数据集有500行，第二个数据集有128行。我提到的是数据集的几行。第一个数据集： Country_name Weather President USA 16 Trump China 19 Xi 第2个数据集 Country_name Weather Currency North Korea 26 NKT China 19 Yaun 我想要比较country_name列，因为我在dataset 1

浏览 0提问于2021-01-06得票数 0

1回答

比较没有外键列的SQL数据库表值

sql、sql-server、sql-server-2012

嗨，我有两张桌子，每一张都在不同的数据库里。数据库名称: Database1 表名:雇员和数据库名称: Database2 表名:雇员 In Database1 I将employee表作为 EmpSno EmployeeID EmployeeName DeptID DeptName 1 1 A 1 Technical 2 2 B 2 NonTechnical 3 3 C

浏览 0提问于2015-01-22得票数 0

1回答

不同长度的数据集之间numid相同的计算差值

r、for-loop、compare

我有两个数据帧："start.date“和"death.date”。每个列包括2列"numid“(数字id)和"date”列。"start.date“是记录每个numid疾病开始的数据集。"death.date“只包括在death.date$date中去世的"start.date”中的numid。我需要计算start.date和death.date对于相同的numid的差异(=生存期)。我就是这么写的： tempi<-as.numeric(factor(start.date$numid)) tempj<-as.nume

浏览 1提问于2014-01-14得票数 1

回答已采纳

1回答

时程计算差

我有两个文本框，想要计算这两个文本框之间的时间差异。我让它起作用了，但它几乎不起作用，至少我认为我只是让它与一些“黑客”一起工作。如果某些东西不正确，它也会失败，并且会抛出一个异常，我想防止这个异常(可能用一个IF，如果它不正确就忽略它)。以下是代码： private void button1_Click(object sender, EventArgs e) { try { var first = TimeSpan.ParseExact(First.Text.Replace("-", ":&#

浏览 1提问于2013-08-29得票数 2

回答已采纳

1回答

基于DateTime算法的EntityFramework查询

c#、entity-framework、linq-to-entities、entity-framework-4.1

我有一个表包含各种列，包括两个DateTime列，Start和End。如何在实体框架上编写linq查询以查找持续时间。我在寻找这样的结果: 2y，3m，2d，6h，4m58s。还有三个重要的限制：我不能向db添加函数或sp 我无法将新的计算列添加到表中我不能在内存中使用像foreach这样的循环操作，根据大量的记录来考虑内存的使用。有什么想法吗？

浏览 0提问于2012-02-27得票数 1

回答已采纳

1回答

重复值数据帧

r、dataframe

我目前正在使用R。我有一个包含三个名称的数据框架，每列一个名称：year1、year2和year3。每列都有一组数字数据。我希望得到的数据帧包括在两个不同列中重复的数据，即:如果num.4在year1和year2中重复，则新数据帧具有num.4，以同样的方式，如果num.5在year2和year3中重复，则新数据帧具有num.5。我尝试了以下代码： newdf1 <- origdf[origdf$year1 == origdf$year2 | origdf$year1 == origdf$year3, c(1)] newdf2 <- origdf[origdf$year2 =

浏览 0提问于2018-02-26得票数 0

1回答

元数据差异的Diffing

diff、file-metadata

有办法使用像diff这样的实用工具来查找两个相同文件层次结构的元数据之间的差异吗？如果我有两个相同的文件结构，比如 root_folder/ file1 file2 folder1/ file3 diff实用程序通常会退出，好像它们是相同的，但是将它们添加到tarball将产生不同的散列。这表明了时间戳、所有权等元数据的不同，但我想知道diff的确切区别和默认行为对我没有帮助。

浏览 0提问于2018-06-13得票数 4

回答已采纳

1回答

如何基于2列合并R上的2个数据帧？

r、dataframe、merge、sas、merging-data

我希望基于R中的2列合并2个数据帧，这两个数据帧称为popr和data列，它们共享相同的2个变量: USUBJID和TRTAG2N，这两个变量是我想要组合这两个数据帧的变量。当我只尝试根据一列进行合并时，合并函数就能工作： merged <- merge(popr,droppedcol,by="USUBJID") 当我试图通过使用2列合并并查看数据框架“工期”时，表是空的，没有值，只有列标题。它说“表中没有可用的数据”。我的任务是在R中复制SAS代码： data duration; set pop combined1 ; by usubjid trtag2n;

浏览 1提问于2019-07-09得票数 2

回答已采纳

2回答

将向量拆分为块，直到事件发生

r、vector、dataframe

我有一个硬币抛出的矢量x <- c("H","H","T","H","T","T","H","H","H","H","T")。我想从上面的向量中构造一个包含两个变量(模式，长度)的数据帧。 Pattern字段将类似于{H H T，H T，T，H T}，相应的长度将为{2,1,0,4} 我的意图是计算连续的正面，直到抛硬币时出现一条尾巴。

浏览 1提问于2016-05-10得票数 4

2回答

求矩阵中最小值的值和索引，按列值分组

matlab

我试图在下面的矩阵中找到每组数据点的最小值和索引： a=[0.3 1; 0.5 1; 0.2 1; 0.4 2 ; 0.43 2; 0.01 3; 0.3 3; 0.23 3]; 数据按第2列中的值分组，即前三行在第一组，后两行在第二组，最后三行在第三组。谢谢

浏览 7提问于2013-05-20得票数 0

回答已采纳

1回答

数据帧中的重复行，使用多个字段检查重复

python、pandas、duplicates、multiple-conditions

我正在尝试识别数据帧中的重复项，基于四个匹配的字段：'dhid_y'，'from_y'，'to_y‘和'bound_y’。下面的代码在带有“子集”的数据帧上使用.duplicated，指向正在考虑的四个字段。结果应该是重复项被标记为'true‘，而第一次出现的项应该保持为'false’。稍后我将在脚本中使用此信息。然而，并不是所有的副本都被发现了。当仅仅使用dhid_y时似乎可以工作，但是当我添加额外的字段时，它似乎表现不佳-尽管它确实运行了！ import pandas as pd df_merged = pd.read_c

浏览 18提问于2020-09-30得票数 0

1回答

具有匹配标头的两个数据帧列之间的相关性

python、pandas、dataframe

我有两个来自excels的数据帧，如下所示。第一个数据帧有一个多索引头。我试图根据货币(即KRW，THB，USD，INR)查找数据帧中的每一列与相应数据帧之间的相关性。目前，我正在执行一个循环来遍历每一列，在找到相关性之前按索引和相应的头进行匹配。 for stock_name in index_data.columns.get_level_values(0): stock_prices = index_data.xs(stock_name, level=0, axis=1) stock_prices = stock_prices.dropna() fx

浏览 22提问于2019-05-03得票数 1

回答已采纳

2回答

Spark:按另一列过滤时的GroupBy和collect_list

arrays、scala、apache-spark、group-by、apache-spark-sql

我有以下数据帧 +-----+-----+------+ |group|label|active| +-----+-----+------+ | a| 1| y| | a| 2| y| | a| 1| n| | b| 1| y| | b| 1| n| +-----+-----+------+ 我想按" group“列分组，并按"label”列收集，同时过滤活动列中的值。预期的结果将是 +-----+---------+---------+----------+ |group|

浏览 46提问于2021-03-31得票数 1

回答已采纳

2回答

对来自不同数据帧的列的数学运算

python-2.7、pandas、jupyter-notebook、pandas-datareader

我有两个数据框，通过熊猫从法马法语和雅虎导入。我正在尝试比较两个数据框中的列值(更具体地说，从另一个数据框中减去一个)，但每当我尝试这样做时，都会出现值错误。数据帧有不同的索引，我不知道如何考虑这个因素(我对python和pandas很陌生)。下面是有问题的代码： start, end = dt.datetime.now()-dt.timedelta(days=60*30), dt.datetime.now() f = data.DataReader('F-F_Research_Data_Factors', 'famafrench', start, end)

浏览 6提问于2016-08-06得票数 2

回答已采纳

4回答

比较两个pandas数据帧并根据条件替换值

python、pandas、numpy、dataframe、data-analysis

我有以下两个熊猫数据帧： df1 A B C 0 1 2 1 1 7 3 6 2 3 10 11 df2 A B C 0 2 0 2 1 8 4 7 其中A、B和C是两个数据帧的列标题。我尝试将df1的列与df2的列进行比较，这样df2中的第一行就是下界，第二行就是上界。df1中超出下限和上限(按列)的任何值都需要替换为NaN。因此，在此示例中，输出应为： A B C 0 nan 2 nan 1 7 3 6 2 3 nan nan 作为一个基础，我正在尝试df1[df1 < df2] =

浏览 0提问于2020-03-29得票数 1

1回答

如何比较两个表中的多列并找出重复的列？

python-3.x、pandas、dataframe

我有两个数据帧数据帧1 ? 数据帧2 ? ID列在两个表中不唯一。我想要比较两个表中除ID之外的所有列，并打印唯一行预期输出 ? 我尝试了“isin”函数，但不起作用。每个数据帧大小为150000，我删除了两个表中的重复项。请建议如何做到这一点？

浏览 20提问于2020-11-03得票数 0

2回答

R-如何添加数据帧的列作为另一个数据帧的列？

r、dataframe、merge

我有两个数据框，尺寸如下： dim (df1) [1] 1418 1 dim (df2) [1] 1418 1 所以我在每个DF中只有1列和相同的行数。我想将第二个数据帧添加到第一个数据帧中，这样我就有了1418行2列的暗淡。我这样做了： df1[,2] = df2[,1] # and this: dfnew = merge (df1, df2) 但是它不起作用。你知道怎么做吗？

浏览 0提问于2018-01-19得票数 0

回答已采纳

2回答

在r中，将数据帧的列转换为没有"unlist“且具有动态名称的向量。

r、benchmarking

我想将数据帧列转换为向量，其中的名称是动态的。我只知道我要的是第一列。现在，我可以用unlist实现这一点，但是它比按名称访问慢了大约两个数量级： df = data_frame(x = 3, y = 4) microbenchmark::microbenchmark({df$x}) #less than 1 microsecond microbenchmark::microbenchmark({unlist(df[,1}) #about 15 microseconds! 如果我事先不知道列的名称，还有比取消列表更有效的方法吗？

浏览 0提问于2019-07-20得票数 1

回答已采纳

1回答

从阵列角度2滤波数据

arrays、angular、filter、mapping

我有两个arrays，我想根据列值过滤数据。我正在使用下面的代码，但它不起作用。 const result = data.map(data1 => { return Object.assign({}, data1, this.data2.filter(data2 => data2.Id !== data1.Id)[0]); }); 数据1 : [ { "id": 2, "name": "data 2", }, { "id": 3, &#

浏览 0提问于2017-05-12得票数 0

回答已采纳

3回答

分组并定位最接近的数字

r、dplyr、tidyverse

数据在页面底部提供。我有两个数据帧df1和df2。 df1: ticker Price <chr> <dbl> SPY 200.00 AAPL 100.00 df2: ticker expiration strike <chr> <dbl> <dbl> SPY 0621 180 SPY 0621 205 SPY 0719 180 SPY 0719 205 AAPL 062

浏览 0提问于2019-06-05得票数 2

回答已采纳

1回答

如何将一个dataframe中的列与diff dataframe中的列的顺序对齐？

python、pandas、dataframe

我有一个按特定顺序排列的166列& 63k行的数据帧。我有另一个166列和35k行的数据帧。第二个数据帧中的166列与第一个数据帧的顺序不同。如何强制第二个数据帧与第一个数据帧的列顺序对齐？( 166列在两个数据帧中是相同的名称)。在谷歌搜索解决方案时，出现了一种方法： df2 = df2[['col1','col2','col3','col4']] 但是有161列，这太乏味了。 X_18 #dataframe 1 X_19 #dataframe 2 # I tried to re-order both on the

浏览 9提问于2019-07-12得票数 2

1回答

R:大数据帧的多个合并

r、dataframe、merge

我有两个大数据帧: DBa和DBb。DBb的所有列都是DBa格式的。我想按DBb的所有列合并这两个数据帧。我在试着： new <- merge(DBa, DBb, by=colnames(DBb)) 但它给了我一个错误： Elements listed in `by` must be valid column names in x and y 我该怎么做呢？

浏览 2提问于2016-11-15得票数 0

1回答

Pandas:列出现在一个df中，而不出现在另一个df中

python、pandas

我有两个数据帧A和b，列分别是a，b，c和c，d，f。我想从数据帧A中选择列' A‘，这样列'c’的元素就会出现在A中，而不是B中。我怎么知道这一点呢？类似于sql中的“从A中选择a，使得c在A中，c不在B中”之类的东西。谢谢!

浏览 12提问于2018-02-06得票数 0

1回答

基于列的两个数据帧的匹配

我有两个一行的数据帧，每个数据帧都有相同的列名。其中一个数据帧在一个或多个列中具有NA值。我希望删除其中一个数据帧中具有NA值的列，并删除第二个数据帧中的相同列。样本：数据框架1： age height education average NA 1.80 college NA 数据框架2： age height education average 36 1.95 college 85 结果：数据框架1： height education 1.80 college 数据框架2： height education 1.95 college 我该

浏览 2提问于2017-05-15得票数 0

回答已采纳

2回答

scala中两种不同列数数据帧的比较

dataframe、scala、apache-spark、databricks

我有两个数据帧df1和df2。 df1有174个列，df2有175个列。我怎么能找到哪一栏是额外的？

浏览 3提问于2021-12-28得票数 1

2回答

更改pandas数据帧多索引中的值

python、pandas、dataframe、multi-index

我有一个数据帧列表，每个数据帧都有一个多索引。一列是圆形，另一列是“varName”。 varName列中的值是数字。我还有另一个数据帧，它是数字到标签的映射。我想在varName列上使用map()，但是因为它是索引的一部分，所以没有varName列。我尝试复制varname列，或者使其不再是索引的一部分，但这些方法似乎都不起作用。

浏览 0提问于2016-06-01得票数 1

2回答

从列条目与另一个数据框重叠的数据框中删除行

r、dataframe、duplicate-removal

我有两个具有基因组数据的数据帧，并且我需要删除数据帧1中的所有行，这些行的“feature”列中的条目等于数据帧2的一行中的“feature”列中的条目。 df1 <- data.frame(feature=c("ENSG419","ENSG1617","ENSG1629","ENSG16230"),distance=c(9833,2460,50538,51162),origin=c("e2","e2","e2","e2")) df2 <- data.fr

浏览 2提问于2013-04-04得票数 0

回答已采纳

4回答

在R中组合两个DFs，并只保留其中有公共日期的行

我对R相当陌生，但我确实试图找到我的问题的答案，但没有成功。我有两个数据帧"Brexit_final“和"Brexit_Google_Trends”。这两个数据帧都有一个“日期”列，但是！Brexit_Final帧的日期比另一个帧少。我想创建一个新的数据集，其中只有行保存在两个框架都有日期的位置。在这个过程中，我还想删除很多列。 Brexit_Final Date Remain Leave Undecided Total_Difference 2016-06-18 42 44 13 7.5 2016-06-20

浏览 10提问于2017-03-22得票数 1

回答已采纳

2回答

返回dataframe值不同的列

python-3.x、pandas

我有两个类似下面的df1和df2示例的数据帧。我想要比较数据帧之间的值，并返回数据帧在列中具有不同值的列。因此，在下面的示例中，它将返回B列。 df1 A B C 1 2 3 1 1 1 df2 A B C 1 1 3 1 1 1

浏览 5提问于2018-10-03得票数 0

1回答

如何根据某个时间段后不发生或确实发生的ID来过滤熊猫数据帧

python、pandas、datetime、filter、pandas-groupby

我有一个pandas Dataframe示例，尝试通过IDS创建经过一段时间后不会出现的过滤数据帧另外，如果可能的话，我知道我的要求太多了，DF有一个额外的列，按分组的IDS进行分组，其中包含true或false，这是发生或没有发生的 ID timestamp 0 x1 2015/09/27 09:10:30 1 x2 2015/10/11 05:10:30 2 x2 2015/12/20 11:10:30 3 x1 2015/11/17 01:10:30 4 x3 2015/09/09 17

浏览 0提问于2018-10-16得票数 0

3回答

比较两个不同大小的数据帧中的每个元素，并在pandas中添加或删除单词

python、string、pandas、dataframe

我有一个关于熊猫数据帧操作的问题假设我有两个不同大小的数据帧(它们具有相同的行数，但没有相同大小的列 a =pd.DataFrame({"code1":['A','B','C','D'],"code2":['E','F','G','H']}) b= pd.DataFrame({"code1":['A1','B','C','D'],"code2

浏览 13提问于2017-12-15得票数 2