从两个具有相等值的数据帧中删除行_从数据帧中删除顶行_从Pandas数据帧中删除行 - 腾讯云开发者社区

r、date、na

我有两个时间和时间的数据帧，大约240列和4100行。在两个数据帧中都有大量NA值，我需要删除这些值，然后从输出时间中减去这些值。我在下面的命令中删除了所有NA值out_time1 <- na.omit(out_time) 然后，当我给出视图(Out_time)时，我只得到数据帧中的头行。我现在无法查看任何数据。为什么会这样呢？同样的情况也发生在in_time数据帧中。请帮助我从这两个数据帧中删除NA值。致以敬意，帕万。

浏览 0提问于2018-08-26得票数 0

回答已采纳

1回答

如何匹配ID号以合并两个数据帧

r、pattern-matching

我有两个数据帧，这两个数据帧的列的ID号应该匹配。然而，这两个数据帧的ID数量不同。一个有118个ID，另一个有103个ID。具有118个ID的数据帧有全部103个ID，但有一些额外的ID。我想从118行数据帧中提取两列，并根据ID号将它们与103行数据帧中匹配的ID合并。我不知道解决这个问题的最简单的方法。

浏览 2提问于2019-02-07得票数 3

回答已采纳

1回答

根据另一个DataFrame中的条件表达式从pandas dataframe中删除行

python、pandas、dataframe、nan

我有两个pandas数据帧，df1和df2，它们的行数相等。df2有11行，其中包含NaN值。我知道如何删除df2中的空行，方法如下： df2.dropna(subset=['HIGH'], inplace=True) 但是现在我想从df1中删除这些相同的行(从df2中删除的行号相同的行)。我尝试了以下方法，但似乎不起作用。 df1.drop(df2[df2['HIGH'] == 'NaN'].index, inplace=False) 还有其他建议吗？

浏览 0提问于2020-09-21得票数 0

1回答

比较2个数据帧，遍历列，计算匹配索引的相似度

python、pandas、numpy、dataframe

我有两个几乎相同的数据帧(A和B)。A&B中的所有列都有相同的唯一标识符，顺序完全相同。每个DF (A和B)的指数几乎相似(农产品、熟食店、乳制品等)。列A包含完整索引，而列B包含A的子集，但有时也可能与A完全匹配。我已经设置了一个循环来同时比较每一列。我在获取每列中每个索引的值时遇到了问题。示例数据帧： import numpy as np import pandas as pd nan = np.nan # dfA dfA = pd.DataFrame( np.array( [ [1, 2, nan, nan],

浏览 19提问于2020-09-23得票数 0

回答已采纳

1回答

R:如何从这个列表中的所有数据帧中删除行？

假设我有一些像这样的数据 n <- 3 K <- 4 dat <- expand.grid(var1=1:n, var2=1:K) dat看起来是这样的： var1 var2 1 1 1 2 2 1 3 3 1 4 1 2 5 2 2 6 3 2 7 1 3 8 2 3 9 3 3 10 1 4 11 2 4 12 3 4 我想同时从列表中的两个数据帧中

浏览 2提问于2015-10-17得票数 2

回答已采纳

3回答

Pandas/Python:如何在不重复的情况下连接两个数据帧？

python、pandas、duplicates

我想将两个数据帧A，B连接到一个没有重复行的新数据帧中(如果B中的行已经存在于A中，则不添加)：数据帧A:数据帧B： I II I II 0 1 2 5 6 1 3 1 3 1 新数据帧： I II 0 1 2 1 3 1 2 5 6 我该怎么做呢？

浏览 1提问于2014-01-24得票数 81

回答已采纳

2回答

基于列值的Python数据分割成多个

python-3.x、pandas-groupby

下面是我从excel上读到的当前数据格式FinalData：现在，我想将数据帧分割成两个，一个数据帧，其中包含具有零或nan范围的所有行，另一个数据帧中的其余行。如何做到这一点，我尝试了下面的代码，但没有工作 amountzeroNanDf=FinalData [FinalData‘range’=0‘range’=np.nan] restDatframe=FinalData[FinalData 'range'!=0 FinalData 'range'!=np.nan] 预期产出: amountzeroNanDf： restDatframe：

浏览 5提问于2019-10-13得票数 0

回答已采纳

1回答

从Excel中删除对立面

excel、if-statement、excel-formula、excel-2013、worksheet-function

我试图找出一种方法来删除净结果为零的值。例如，我有数据，即10,000和-10,000。它们是与同一个人相关联的，虽然不是唯一与单个人相关联的交易。是否有方法从我的Excel文档中删除这两行？我想移除最后一行，因为它是唯一唯一的行。

浏览 3提问于2015-12-08得票数 1

回答已采纳

1回答

networkx是如何处理2元组的？

python、pandas、networkx

我正在尝试构建一个网络，其中我的边由元组组成。我尝试对所有相关元素进行分组，但仅基于元组中的单个元素。类似于：注:熊猫23.4 给定以下数据帧： col1 col2 col1Name col2Name 'A' 'B' '12345' '78911' 'C' 'B' '12345' '78911' 'J' 'K

浏览 0提问于2019-06-21得票数 1

1回答

Bigquery:排名函数

sql、google-bigquery、rank

我试图在bigquery中生成低于排名的结果。我可以生成rank1，但无法在rank_2中获得期望值。有人能帮帮忙吗？代码： dense_rank() over (partition by user_id order by product_id,timestamp_added desc) as rank1, 数据： product_id | user_id | rank1 | rank_2 | Timestamp 100 | 10 | 1 | 1 | 2021-05-03 14:10:10 100 | 10

浏览 11提问于2021-08-27得票数 0

4回答

删除缺少数据的行。如何省略数据框中任一列缺少值的行

r、missing-data

我想创建一个忽略丢失数据的新数据框。我的数据是两个独立的人给一个事件打分，从1到5。我希望省略任何行，其中任何一行缺少来自评核人1或评核人2的数据，以创建一个仅包含这两个评分者分数的数据框。以便该数据帧： DF <- data.frame("rater 1"=c(1,4,NA,3,2), "rater 2"=c(1,NA,3,2,3)) head(DF) 如下所示： DF_omit <- data.frame("rater1"=c(1,3,2), "rater 2"=c(1,2,3)) head(DF_omit)

浏览 28提问于2020-12-14得票数 0

回答已采纳

1回答

去捕捉这个场吗？

regex

我想提取与值123相对应的参数名。对于这两个字符串 [param1=456&param2=123] [param2=123&param1=456] 我想找到这个价值 param2 此正则表达式适用于第一行，但不适用于第二行。 &([\S]*)123 此正则表达式适用于第二行，但不适用于第一行。 [&|\[]([\S]*)123

浏览 1提问于2018-07-09得票数 1

回答已采纳

1回答

当合并的行不匹配时，如何在pandas merge中填充值

python、python-3.x、pandas、merge

我有两个数据帧，它们有一个公共的"License Number"列。我想将它们与indicator合并，这样以后我就可以选择left_only或right_only来查找只出现在其中一个数据帧中的条目。然而，我发现在合并时，只要A和B中的条目相同，一切都会正常进行，所以从理论上讲，这对于所有条目都相等的相同大小的数据帧来说是完美的。如果A中有条目，但B中没有条目，合并仍然会从B中提取行数据，并将其放在A中的数据旁边，即使用于合并的键(License Number)在这些行之间不匹配。下面是我是如何做的()： merged_sheet = pd.merge(df1, df2

浏览 9提问于2017-07-06得票数 1

回答已采纳

1回答

使用pd.merge_asof的"ValueError:合并关键字在右侧包含空值“

pandas

我正在尝试使用pd.merge_asof合并两个数据帧。df2中有一个与df1中的“Date1”相关的“Date2”。但是，有一些行没有'Date2‘。我尝试了下面的代码来合并两个数据帧，但是我得到了以下错误: ValueError: merge key在右侧包含null值 df3 = pd.merge_asof(df1.sort_values('Date1', ascending=True), df2.sort_values("Date2",ascending=True),

浏览 23提问于2019-12-22得票数 1

回答已采纳

1回答

如何在Matlab中找到向量的一个分段的最低平均值？

matlab

我有一个非常长的列向量(20000长度)。在这20000个值的列表中，我希望找到100个产生最低平均值的邻近值。我可以想象某种长度为100的帧沿着向量移动，matlab计算所有可能的平均值，然后返回最低的一个。目标是-我希望找到向量中的最小值，但更愿意找到最小的平均值(使用100作为采样帧)，以排除找到低随机噪声块的可能性。一个冗长的问题，但感谢任何帮助。谢谢，克里斯

浏览 1提问于2014-04-04得票数 0

2回答

排除2个数据帧R的相同行

r、dataframe、twitter

我有两个数据帧，包含关于df1 =儿子，df =女儿的推文。在分析时，我碰巧注意到，有些行必须是相同的。总之<- unique(rbind(df1，df2))显示确实有587行相同(通过从df1+df2中减去它)，如何识别它们？或者，更重要的是:将它们从两个数据帧中排除？

浏览 1提问于2018-05-23得票数 0

2回答

删除在整个数据帧中迭代的具有特定条件的观测值

python、pandas

我相信这个问题已经提出了好几次，但由于某种原因，我找不到答案。基本上，我有一个包含500个变量(列)和15000个观察点(行)的数据帧。在所有的观察值中，变量的值从-140到100。基本上，我需要删除一些值介于-20和0之间的观察值(行)。我尝试过(X_train是500个变量)： for i in X_train.columns: a=X_train[(X_train[i] >= -20) & (X_train[i] <= 0) ] 还有这个： a = X_train[(X_train.iloc[:,:].values > -20) &

浏览 29提问于2020-02-15得票数 0

1回答

从新添加的第二个Dataframe中提取行，与第一个Dataframe进行比较

我有两个数据帧，我需要在第二个数据帧中找到新添加的行，这意味着我的第一个数据帧有一些行，而我的第二个数据帧可以从我的第一个数据帧和其他一些行中有几个行。我需要找到那些不在第一个数据帧中的行。这意味着只在我的第二个数据帧中的行。下面是输出的示例 comp1<- data.frame(sector =c('Sector_123','Sector_456','Sector_789','Sector_101','Sector_111','Sector_113','Sector_115'

浏览 0提问于2020-06-22得票数 0

1回答

大熊猫随机数据对的选择

python、pandas

我有一个很大的文件，有三列。前两个是整数，第三个是字符串。我在用熊猫的时候读到 data = pd.read_csv("edges+stuff.txt", sep=' ', header=None, dtype={0:np.uint32, 1:np.uint32, 2:np.str}) 下面是一些假数据示例： 2 0 Somestuff9 2 0 Somestuff0 1 1 Somestuff5 0 0 Somestuff7 2 0 Somestuff9 2 0 Somestuff5 2 1 Somestuff2 1 1 Somestuff8 1 1 Some

浏览 4提问于2016-08-04得票数 0

回答已采纳

2回答

如何才能获得与另一个数据帧相比在唯一类成员资格(在列上)方面不同的数据帧行？

python、pandas、dataframe、pandas-groupby

有两个数据帧(A和B)具有相同的列模式和相同的行数，并且这两个数据帧都按行号进行索引。其中一列将类成员身份表示为整数。我希望有效地从A获得在此列上的唯一类成员身份方面不同(相对于B)的行。示例(行号是索引，不是列)： A Rownumber | Class 1 | 52 2 | 52 3 | 91 4 | 556 5 | 556 B Rownumber | Class 1 | 1 2 | 2 3 | 2 4 | 3 5 | 3 输

浏览 8提问于2020-09-30得票数 1

回答已采纳

3回答

从dataframe 1中删除行，其中dataframe2中的等效行具有空值

python、pandas、dataframe

我有两个数据框架，我使用两个数据框架中的最后一列来计算分类度量。我想确保值是正确的，我的一个数据帧正在从数据库中加载，并且有可能在该数据帧中获得NaN值。我想从两个数据帧中删除由NaN值组成的行，我的其他数据帧不会有任何NaN，但是我希望检查第一个数据帧中的NaN值，并从第一个和第二个数据帧中删除等效的行，这样我的分类只会发生在实际值上。我不知道如何做到这一点。

浏览 7提问于2020-05-20得票数 2

回答已采纳

1回答

查找两个数据帧之间不匹配的行

python、pandas、dataframe

我有一个场景，我希望在两个数据帧之间找到不匹配的行。这两个数据帧都有大约30列和一个唯一标识每条记录/行的id列。因此，我想检查df1中的行是否与df2中的行不同。df1是更新后的数据帧，df2是以前的版本。我尝试了一种方法pd.concat([df1, df2]).drop_duplicates(keep=False)，但它只是将两个数据帧结合在一起。有办法做到这一点吗。如果能帮上忙我会很感激的。这两个dfs的示例数据如下所示。 id user_id type status 总共有39列，其中可能包含NULL值。谢谢。 P.S. df2将始终是df1的子集。

浏览 11提问于2020-09-28得票数 1

3回答

R中数据帧交替行绑定

r、rbind

我有两个数据帧，它们具有完全相同的列和相同数量的行。我想创建一个新的数据帧，其中包含两个数据帧，但有交替绑定的行。它必须从第一个数据帧中取出一行，从第二个数据帧中取出一行，直到整个新数据帧被建立。我尝试过使用rbind()，但没走运。我需要一个不包括安装新的R包的解决方案。演示图片：编辑:我的行数是动态的，可以非常大。此外，我需要一个不依赖于列名的解决方案，因为结构也是动态的。我知道这两个数据帧每次都有相同的结构。

浏览 14提问于2018-12-14得票数 1

回答已采纳

1回答

为什么`row.names`比‘`rownames`’更受欢迎？

在R核心库中有两个功能。获取和设置数据帧的行名检索或设置类似矩阵的对象的行名。但是，row.names的文档为数据帧指定了“行名”和“冒号”，最后分别调用了“row.names”和“name”，但后者是首选。为什么row.names是首选？难道忽略row.names只打电话给rownames不是更容易吗？

浏览 1提问于2016-07-19得票数 32

回答已采纳

1回答

比较两个data.frames并根据一个data.frame中的NA值删除行

我有两个数据帧。其中一个被认为是一个引用并具有每个值，另一个可能是缺失的值，也可能不是缺失的值。我想比较这两个数据帧，然后从另一个具有NA的参考数据帧中删除值。但是，数据帧中可能有缺失值的每一行都需要作为单个比较来处理，因此您正在为每一行开发一个唯一的引用。例如，引用dataframe(1)： var1 var2 var3 1 a b c 2 q w e 3 z x n 其他数据框架(2)： var1 var2 var3 1 p o i 2 u

浏览 3提问于2015-12-30得票数 0

回答已采纳

2回答

根据行号删除数据格式的行

python、pandas、numpy、dataframe、indexing

假设我有一个数据帧(DF)，还有一个类似于这样的数组： rm_indexes = np.array([1, 2, 3, 4, 34, 100, 154, 155, 199]) 我想从rm_indexes中从DF中删除行号。rm_indexes中的一个表示第一行(DF的第二行)，三个表示数据帧的第三行，等等(第一行是0)。此数据帧的索引列为时间戳。 PS. i有许多相同的时间戳作为数据帧的索引.

浏览 0提问于2019-04-25得票数 6

回答已采纳

1回答

从熊猫数据帧中提取子集以确保没有重叠？

python、pandas、dataframe、datetime、sampling

假设我有2个Pandas数据帧，df维度为297232 x 122维度，df_raw维度为840380x122维度。df已经是df_raw的一个子集。两个数据帧的索引都是DateTime。我想从df中取值的70%，从df_raw中取值的30% (如果需要，可以随机采样)，同时确保采样的数据帧子集在索引方面没有重叠。更准确地说，df_subset将从df中随机选择70%个值，df_raw_subset将从df_raw中随机选择30%个值，但df_subset和df_raw_subset不应该包含采样行方面的重叠，即它们应该具有唯一的DateTime索引。

浏览 20提问于2019-11-22得票数 2

回答已采纳

1回答

如何在Pandas中比较两个数据帧并删除数据帧中不匹配的行？

python-3.x

我是python (尤其是熊猫)的新手。我有两个数据帧df1和df2。df1有200行。df2有250行。索引值也包含重复项。 df1: ProcessID 248 436 500 500 另一个数据帧 ProcessID Day Time Status 248 Sun 23:26:51 completed 436 Sat 01:50:56 completed 500 Thu 14:18:21 completed 500 Wed 23:00:15

浏览 3提问于2018-04-08得票数 0

1回答

Python3 pandas -迭代两个数据帧之间的记录，并按列组计算最小距离

python、pandas、loops、distance

我有两个不同的熊猫数据集(python3)，它们具有相同的结构(列: country，region，week，COL1-COL180)。D1很小，大约300行，D2超过200k行。对于D1 (小数据帧)中的所有记录/行，我希望遍历D2数据帧中的行，匹配country+region，并提取与D1中的记录最相似的记录。相似性是通过计算列col1-col180中的值之间的距离来确定的。基本上是distance=sum(D1.COLi-D2.COLi)^2，其中i的范围是从0到180。应选择此距离最小的记录，并将其保存在单独的数据帧中。

浏览 12提问于2019-11-23得票数 0

3回答

根据来自另一列的值从一列中选择值- python

python、pandas

我有一个很大的数据帧df1，看起来像这样： DeviceID Location 1 Internal 1 External 2 Internal 2 Internal 3 Internal 3 External 3 Internal 4 Internal 4 Internal 5 External 5 In

浏览 0提问于2019-09-25得票数 2

2回答

在Pandas中以不同的时间间隔合并和填充两个数据帧

python、pandas、merge

我有两个数据帧我想在Pandas中合并。它们都有一个我正在合并的日期时间列，但是，一个每分钟和5分钟有行(取决于年份)，而另一个dataframe每15分钟有行。如果我执行一个外连接，我可以合并它们，但是每15分钟才会有来自两个数据帧的数据。我想复制15分钟的数据，并用这些数据填充每1或5分钟的行。因此，12:00AM的数据将填充12:14之前的所有行(包括12:14然后，12:15 to会被复制，并填写到12:29 to等。这有意义吗？我如何才能做到这一点？看起来很相似，但我不确定如何为我的确切场景实现，特别是考虑到我的一个数据帧在不同的年份从5分钟到1分钟的间隔。

浏览 0提问于2014-12-19得票数 4

1回答

合并Pandas数据帧

python、pandas、dataframe、merge

所以，我有两个熊猫数据帧： a b abc def ghi jkl mno pqr 和 a b abc def ghi jkl stu vwx 我想做的是合并这些数据帧，但只保留不重叠的数据帧(数据帧1和2中的第3行) a b stu vwx mno pqr

浏览 7提问于2017-02-21得票数 1

1回答

返回两列匹配的位置

excel、matching

如果这是以前的请求，请原谅，任何帮助都是非常感谢的。我有下面由数千行组成的数据。我只需要隔离field1和field2列匹配的行。有没有在excel中执行此操作的快速方法？ FileID1 FileID2 Hash 27468 27462 8BEA348CA9301F6459F8E8A2DD126D7C 29874 29843 EEFFBC24EAE3F4FD5ED5232993081A36 31150 1126 AE3675DC487DEF0F9C9FEC42B81B1438 **32330 32330 59D77968DB2FE6AFE42EEC2

浏览 0提问于2017-09-16得票数 0

3回答

R循环删除列中一个字符串到第二个字符串的行范围

r、for-loop、subset

我试图从数据帧中删除行序列，序列以已知字符串开始，以已知字符串结尾，但中间行的内容和数目未知。我想在整个数据帧中迭代这一点。例如，如果数据框架如下所示，我希望从StringA的所有实例中删除行到StringB (包括在内)，但保留StringB之后直到下一次StringA重复出现的行；例如，我想删除包含StringA、unknownC、unknownD、unknownS、StringB的行，然后保留unknownK和unknownR，然后继续删除StringA、unknownU、unknownP、StringB，但保留unknownT。 Column 1 Column 2 StringA

浏览 5提问于2016-05-27得票数 6

回答已采纳

1回答

Dcast()奇怪的输出

r、dcast

我有两个数据帧。对这两个函数应用相同的dcast()函数会在输出中得到不同的结果。这两个数据集具有相同的结构，但大小不同。第一个有超过950行： ? 我应用的代码是： trans_matrix_complete <- mod_attrib$transition_matrix trans_matrix_complete[which(trans_matrix_complete$channel_from=="_3RDLIVE"),] trans_matrix_complete <- rbind(trans_matrix_complete, df_dum

浏览 17提问于2019-06-25得票数 0

回答已采纳

2回答

使用来自另一个Dataframe的索引替换Dataframe中的行

python、pandas

我有两个具有相同结构的数据帧df和df_a。df_a是df的子集，我需要将其重新集成到df中。从本质上讲，df_a有来自df的各种行(具有不同的索引)，这些行已经被操作过。下面是每个df和df_a的索引示例。它们都有相同的列结构，所以所有的列都是相同的，只是行和行的idex有所不同。 >> df index .. other_columns .. 0 1 2 3 . . 9999 10000 10001 [10001 rows x 20 columns] >> df_a index .. other_columns .. 5 12 105 712

浏览 34提问于2020-05-08得票数 4

回答已采纳

3回答

过滤数据帧

python、pandas、dataframe、filter

如何根据2列之间的值过滤出数据帧中的行。请参考图片。我的预期结果是A列中的TRUE和B列中的TRUE之间的行。正如在图像中突出显示的那样，预期结果是两个数据帧，其中第一个数据帧df1的行数应该从索引2到6，第二个数据帧df2的行数应该从索引10到16

浏览 3提问于2020-02-05得票数 0

1回答

来自两个不同数据帧的行的平均值

python、pandas、mean

我有两个数据帧，它们的列共享相同的名称。我想从不同数据帧的两列中找到行均值，并将其保存在一个新的数据帧中。新的数据帧将具有相同的行数(0-95)，并且这些值将是使用两个数据帧作为输入的相同行的平均值。数据帧具有不同的索引值，第一个索引值从0到95，第二个数据帧从96到191，但它们具有相同的长度(即96)。 ? ?

浏览 14提问于2019-10-04得票数 0

回答已采纳

1回答

星火DataFrame中每一行的随机数

hive、apache-spark-sql

我正在将两个表格从蜂箱中读取到dataframes中，并希望将一个唯一的数字与两个数据帧中的行关联起来。在数据帧中以及在两个数据帧中，数字应该是唯一的。我读过关于在从蜂巢查询时使用row_source()函数的文章，但是对于这两个数据帧，数字并不是唯一的。请提出解决办法。

浏览 3提问于2016-10-15得票数 0

1回答

Panda's left merge:结果表有更多行，防止重复

python、pandas、merge

我有两个数据帧。df1有39780行，df2有8900454行我要合并的后缀的列：['postalcode','housenumber', 'suffix']‘df1’列包含一些NAN。 df2列： ['postalcode_right','housenumber_right', 'suffix_right', 'index_right'] (名为“index_right”的列不是该数据帧的索引。) df2 = pd.merge(df1, df2, how='left&#

浏览 1提问于2018-08-29得票数 1

回答已采纳

4回答

比较R中的两个数据帧对象是否相等？

r、dataframe、compare、equality

如何检查两个对象(例如数据帧)在R中的值是否相等？所谓值相等，是指一个数据帧的每一列的每一行的值等于第二个数据帧中相应行和列的值。

浏览 3提问于2012-05-15得票数 57

回答已采纳

4回答

检查dataframe中的行是否存在于另一个dataframe中，并从两个dataframe中删除

python、pandas、dataframe

我正在尝试检查一个数据帧中的行是否存在于另一个数据帧中，如果存在，我想将它们从两个数据帧中删除。到目前为止，我看到的所有示例都使用pd.merge，但它们合并到一个数据帧中。我的目标是保留两个单独的数据帧，只删除公共行。示例如下： df1: id name class Grade 0 2547 John Math 119.01 1 2547 Joe

浏览 0提问于2021-05-25得票数 1

1回答

删除熊猫中特定列中最小值的行

python、pandas

我使用熊猫的nsmallest来查找特定列中具有最小值的n行，如果我正确理解它返回数据帧对象；如何从数据帧中删除这些行？熊猫的drop只获取行索引，而不是数据框架

浏览 1提问于2021-04-22得票数 1

回答已采纳

2回答

Pandas通过为数据帧之间的每个重复行仅删除一行来合并两个数据帧

python、pandas、dataframe

我有两个数据帧，我正在合并它。在合并时，它应该删除重复项。但是对于帧1中的一个重复行，它应该只删除帧2中的一个重复行，即使有两个这样的行，如下面的df1： colA colB colC 1 2 3 1 1 2 1 5 4 df2： colA colB colC 1 2 3 1 2 3 1 1 2 结果： colA colB colC 1 2 3 1 5 4 这里从两个数据帧中删除了1组1 2 3(但保留了另一组1 2 3数据集)。已从两个数据帧中删除%1%1%2集。%1%5%

浏览 32提问于2021-01-23得票数 1

回答已采纳

3回答

按列比较两个熊猫数据帧的行，并保持较大和。

python、numpy、pandas、dataframe

我有两个具有相同结构的I的数据帧： X, Y, Value, ID 这两者之间的唯一区别应该是列值中的值--它可能首先需要按ID排序，因此两者都有相同的行顺序来确保。我希望根据列值逐行比较这两个数据帧，并根据值较大的位置将该行保持在第一或第二行。我还想看看如何从两个数据帧中为值列的和添加额外的列和。我会为任何例子感到高兴，包括使用numpy，如果你觉得它是更好使用这个比潘达。编辑：，在测试了第一个答案中的示例之后，我才意识到，我所拥有的数据帧完全丢失了ids为null的行。这使得两个数据帧具有不同的行数。因此，还可以包括如何使它们在比较之前保持相同的大小--使用ID和0从彼此之间添加缺少

浏览 4提问于2015-12-11得票数 2

回答已采纳

1回答

将结果从一个数据帧移动到数据集

我正在使用两个不同的数据集，我希望将数据从一个数据集移动到另一个数据集。我是这样想的:一个包含结果，与正确的因子(HTm)配对，我想把它们分散到另一个帧上。这是第一帧： head(five) Week Game.ID VTm VPts HTm HPts HDifferential VDifferential 1 1 NFL_20050908_OAK@NE OAK 20 NE 30 10 -10 2 1 NFL_20050911_ARI@NYG ARI 19 NYG 42 23

浏览 9提问于2012-05-11得票数 0

5回答

查找数据帧的补码(反连接)

r、join、merge、r-faq

我有两个数据帧(df和df1)。df1是df的子集。我想得到一个数据帧，它是df中df1的补码，即返回第一个数据集在第二个数据集中不匹配的行。举个例子，数据帧df： heads row1 row2 row3 row4 row5 数据帧df1： heads row3 row5 则所需的输出df2为： heads row1 row2 row4

浏览 67提问于2015-02-25得票数 42

回答已采纳

1回答

Python -查找两个数据帧之间的行差异

python、python-3.x、pandas、dataframe

我有两个数据帧，它们的列数相同，分别是d1和d2。注意: d1和d2可能有不同的行数。注意: d1和d2可能不会被索引到每个数据帧中的同一行。检查两个数据帧是否具有相同数据的最佳方法是什么？我当前的解决方案包括将两个数据帧添加到一起并删除任何匹配的行。 d_combined = d1.append(d2) d_discrepancy = d_combined.drop_duplicates(keep=False) print(d_discrepancy) 我是python和pandas库的新手。因为我将使用具有数百万行和8-10列的数据帧，有没有更快、更有效的方法来检查差异？还可以显示结

浏览 1提问于2017-08-15得票数 1

1回答

基于两列对数据框进行采样

r、dataframe、sample

我有一个数据框，比如 df <- data.frame(matrix(rnorm(40), nrow=20)) df$color <- rep(c("blue", "red", "yellow", "pink"), each=5) df$score <- rep(c(1,2,3,5), each = 5) 我想将基于两列color和score的行采样到两个数据帧中，这样我就可以从每个数据帧中的每组中获得几乎相等的行数。例如，我有5行颜色为蓝色且得分为1的行。我想在一个数据帧中使用2行，在另一个数据帧中使用3行

浏览 8提问于2019-12-16得票数 0

1回答

与熊猫一起读取csv时“skiprows”的问题

pandas

我有一个很大的数据帧(大约500万行)，其中包含一些错误的数据。我已经识别了具有错误数据的行的索引，现在我正在尝试从数据帧中删除“错误”的行。由于数据帧的大小，我在读取csv时使用了chunksize功能。为了跳过“错误”的行，我使用了skiprows和error_bad_lines features。我还使用low_memory特性来防止警告(出于示例的目的，我只读取了前20000行)。然后，我将新数据帧保存在新的csv中。问题是，只有前9个“错误”行被跳过，然后“错误行”仍然被读取(并保存到输出csv)。下面是我的代码： for df in pd.read_csv('dat

浏览 14提问于2020-09-25得票数 0

回答已采纳