两个数据帧，如果值在第二个df的范围内，则连接ID和来自一个df的位置 - 腾讯云开发者社区

python、pandas、dataframe、vlookup

我正在尝试连接两个数据帧，但无法理解Python必须提供的可能性。第一个数据帧： ID MODEL REQUESTS ORDERS 1 Golf 123 4 2 Passat 34 5 3 Model 3 500 8 4 M3 5 0 第二个数据帧： MODEL TYPE MAKE Golf Sedan Volkswagen M3 Coupe BMW Model 3 Sedan Tesla 我想要的是在第一个数据帧中添加另一个名为"make“的列，这样它看起来就像这样： ID MODE

浏览 45提问于2017-01-07得票数 12

回答已采纳

1回答

如果匹配，则将dataframe中的单词更改为来自不同dataframe的其他单词

python、pandas、dataframe、comparison

我在比较数据帧时遇到了一些问题。我有两个数据帧，第一个有标记化的单词。 df_1: id sentence some more info 1 [I, am, happy] bla 2 [I, am, happier] bla 3 [I, am, the, saddest] bla 和 df_2: id word more most 1 happy happier happiest 2 sad sadder saddest 我想要做的是比较两个数据帧，如果df_1中的一个单词与d

浏览 6提问于2021-10-18得票数 1

回答已采纳

2回答

如何合并两个数据帧并将R中的同名列替换为其他列

我在R中有以下两个数据帧 df1 key volume name hours location ABC 456 SS32 34.34 London ERT 34 SS31 33.14 London TYU 21 SS33 3 London GHU 678 SS35 1.30 London THU 67 SS35 0.30

浏览 0提问于2017-10-27得票数 0

3回答

在pandas中组合两个数据帧

python、pandas

我有两个数据帧： df： portfolio symbol id var1 var2 var3 df1： symbol sector market count 我想将列sector和market从df1添加到df。df1具有symbol的唯一值，因此数据帧比原始数据帧df小。我试着这样做： pd.merge(df,df1,on='symbol',how='outer') 但是输出扩展的行比预期的要多。这里遗漏了什么，有人能帮上忙吗？谢谢

浏览 41提问于2020-04-24得票数 1

1回答

具有特定索引列的pandas combine_first？

python、pandas

我正在尝试连接pandas中的两个数据帧，以实现以下行为:我想在指定的列上连接，但要让它不会将多余的列添加到数据帧中。这类似于combine_first，不同之处在于combine_first似乎不接受索引列可选参数。示例： # combine df1 and df2 based on "id" column df1 = pandas.merge(df2, how="outer", on=["id"]) 上面的问题是，除了"id“之外，df1/df2共有的列将被添加两次(带有_x,_y前缀)到df1。我如何做一些事情，比如： # Do o

浏览 0提问于2013-03-28得票数 2

回答已采纳

2回答

从数据帧中删除相同的行-Pandas

python、sql、pandas

我试图删除两个数据帧之间匹配的相同行。无论如何，我尝试相同数据帧中相同行的方法也会被删除。但是我想从相同的数据帧中保留相同的行，并删除那些只与其他数据帧匹配的行。 Dataframe 1: ID PID PDate Amount AAAAAA NN11 20210525 386 BBBBBB A12 20210525 3300 BBBBBB A12 20210525 3300 CCCCCC B11

浏览 0提问于2021-06-08得票数 0

回答已采纳

2回答

在python中连接公共列上的两个数据帧

python、pandas、join

我有一个数据帧df： id name count 1 a 10 2 b 20 3 c 30 4 d 40 5 e 50 这里我有另一个数据帧df2： id1 price rating 1 100 1.0 2 200 2.0 3 300 3.0 5 500 5.0 我想在列id和id1上连接这两个数据帧(这两个数据帧引用相同)。以下是df3的一个示例： id name count price rating

浏览 0提问于2017-01-04得票数 36

回答已采纳

2回答

如何检查某一列的值是否等于另一列数据框中的值

python、pandas、dataframe

我有两个独立的数据帧df和xls。Xls是一个包含唯一is的数据帧，我希望看到这些is在我的df数据帧(~650,000行)中出现了多少次，然后创建一个事件列，跟踪来自我们的xls数据帧的唯一is在df数据帧中出现的次数。 xls = {'Unique ID': ['a', 'b', 'c', 'd', 'e'} df = {'Contingency': ['a', 'b', 'c', 'd', 'a',

浏览 3提问于2020-05-20得票数 2

3回答

在两个Pandas数据帧中查找公共行(交集)

python、pandas、dataframe、intersect

浏览 0提问于2013-10-27得票数 75

回答已采纳

1回答

在R数据帧索引中，比较可以做什么？

我想了解下面的代码实际上是做什么的。我的目的是用df2的" Pop“列中的数据填充df1中的Pop列，按列"ID”匹配行。 df2$Pop <- df1[df1$ID == df2$ID,]$Pop 如果没有排序行(它只需要查找与is匹配的数据)，那么如果一个数据帧大于另一个数据帧(有更多的行)，情况会怎样？昏迷的顺序重要吗？我不知道前面的代码行会有什么结果。它是否像merge那样工作(如果在df1中只有ID和Pop列)？如果是的话，为什么这两个版本(优点/缺点)？ df2 <- merge(df2, df1, by = "ID", all = FA

浏览 3提问于2014-09-12得票数 1

回答已采纳

2回答

使用特定列连接两个pandas数据帧

python、join、pandas、dataframe

我是pandas的新手，我正在尝试基于一个特定列的相等性来连接两个数据帧。例如，假设我有以下内容： df1 A B C 1 2 3 2 2 2 df2 A B C 5 6 7 2 8 9 两个数据帧具有相同的列，并且只有一列(例如A)的值可能相等。我想要的输出是： df3 A B C B C 2 8 9 2 2 列'A‘的值在两个数据帧中都是唯一的。谢谢

浏览 0提问于2015-06-02得票数 20

回答已采纳

2回答

Pyspark:通过ID和最近日期向后加入2个数据帧

python、sql、join、pyspark

在pyspark (和一般的python )中执行两个数据帧的滚动连接时，我遇到了很多问题。我希望将两个pyspark数据帧通过它们的ID和最近日期反向连接在一起(这意味着第二个数据帧中的日期不能晚于第一个数据帧中的日期) Table_1： Table_2：期望的结果：从本质上讲，我知道SQL查询可以做spark.sql(“查询”)等任何事情。我尝试了几种在spark环境下不起作用的方法。谢谢!

浏览 1提问于2020-08-08得票数 2

1回答

连接数据帧并将一列替换为另一列

r、dplyr

我有两个数据帧，一个包含我所有的数据，另一个带有一些数据的更正ID号。当我尝试用左连接、内连接或完全连接连接这些值时，我将得到两个ID列(ID.x和ID.y)。是否存在这样的操作，以便更正后的数据集中的ID只替换完整数据集中的ID？例如， df.full <- left_join(df.full, correctID, by = c("value")) 我试过复制=真和假，但这似乎没有帮助。

浏览 2提问于2019-02-05得票数 5

回答已采纳

1回答

按输出串联多只熊猫群

python、pandas、concatenation、pandas-groupby

我希望在给定数据集的不同子集上进行多个.groupby()操作，并将它们全部绑定在一起。例如： import pandas as pd df = pd.DataFrame({"ID":[1,1,2,2,2,3],"Subset":[1,1,2,2,2,3],"Value":[5,7,4,1,7,8]}) print(df) ID Subset Value 0 1 1 5 1 1 1 7 2 2 2 4 3 2 2 1 4 2

浏览 0提问于2019-08-23得票数 2

回答已采纳

2回答

根据另一个数据帧中的列替换列值

r、dataframe

我想根据另一个数据帧中的列替换df中的某些列值，这是第一个df的头： df1 A tibble: 253 x 2 id sum_correct <int> <dbl> 1 866093 77 2 866097 95 3 866101 37 4 866102 65 5 866103 16 6 866104 72 7 866105 99 8 866106 90 9 866108

浏览 0提问于2019-12-02得票数 0

回答已采纳

1回答

数据帧更新了吗？

python、pandas、dataframe

我有以下两个数据帧： df = pd.DataFrame({'ROU': ['A', 'A', 'A'],'Pre': ['3.0.0.0', '4.0.0.0', '3.0.0.0'],'A_s': ['1', '2', '1000']}) new_df = pd.DataFrame({'ROU': ['A', 'A'],'Pre': [

浏览 14提问于2020-09-16得票数 0

3回答

在R结果数据帧中合并数据帧太大

r、dataframe、merge、inner-join

我正在尝试合并R中的两个数据帧，通过它们共享的一列来连接它们。下面是两个数据帧的屏幕截图，我在"INC_KEY“列上合并。这是我用来合并两个数据帧的代码: dp <- inner_join(d，p，by="INC_KEY") D有177156个观测值，p有1641137个观测值，但最终合并的数据帧有8416113个观测值，这对我来说没有意义。我还尝试将上面的inner_join函数更改为merge函数，但仍然得到相同的结果。我想知道如何修复这段代码，以便合并后的数据帧具有真实的观察值--非常感谢您的帮助！

浏览 0提问于2021-01-11得票数 0

2回答

Python Pandas -连接具有不同行数和列数的两个数据框

python、pandas、data-science、data-analysis

我有两个不同行号和列的数据帧。这两个表都有几个公共列，包括"Customer ID“。这两个表的大小分别为11697行×15列和385839行×6列。客户ID可能在第二个表中重复。我想要连接这两个表，并想用客户ID合并相似的列。一张桌子看起来像这样- 另一个看起来像这样- 我正在使用下面的代码- pd.concat([df1, df2], sort=False) 只是想确保我没有丢失任何信息？如何检查是否存在具有一个ID的多个条目，以及如何将其合并到一个结果中？编辑- 当我使用上述代码时，下面是数据集中NA的之前和之后的值- 有没有人能告诉我，我哪里出错了？

浏览 2提问于2019-06-15得票数 1

1回答

如何在pandas中使用索引连接两个数据帧？

python、pandas、dataframe

我有以下数据帧df1 value 0 0.164560 1 0.000000 2 0.350000 3 0.700000 ... 3778 0.350000 3779 0.000000 3780 0.137500 3781 0.253333 和另一个数据帧df2 0 1 2669 1.744478e-05 2.323815e-05 5417 2.274561e-06 5.808474e-04 6102 2.220705e-06 1.605110e-04 40

浏览 20提问于2019-02-01得票数 1

回答已采纳

2回答

当用dplyr连接两个数据帧时，我可以替换NAs吗？

r、dplyr

我想加入两个数据帧。有些列名重叠，其中一个数据帧的重叠列中有NA条目。下面是一个简化的示例： df1 <- data.frame(fruit = c('apples','oranges','bananas','grapes'), var1 = c(1,2,3,4), var2 = c(3,NA,6,NA), stringsAsFactors = FALSE) df2 <- data.frame(fruit = c('oranges','grapes'), var2=c(5,6), var

浏览 1提问于2016-08-23得票数 11

回答已采纳

1回答

通过连接比较两个pyspark数据帧

python、dataframe、join、pyspark

我有两个pyspark数据帧，它们的行数不同。我试图通过在多个键上连接这两个数据帧来比较所有列中的值，这样我就可以找到这些列中具有不同值的记录和具有相同值的记录。 #df1: +-------+----------+----------+----------+ |id |age |sex |value +-------+----------+----------+ | 1 | 23 | M | 8.4 | 2 | 4 | M |2 | 3 |16 | F | 4.

浏览 14提问于2021-02-13得票数 0

1回答

合并/连接Pandas数据帧

python、pandas、dataframe、join

我有两个数据框，第一个来自岛上的一家摩托车租赁公司，它包括关于摩托车类型、持续时间、开始和结束时间以及许多其他字段的数据，第二个包括来自这个岛屿的气象数据。由于每天的气象数据每3小时有8个记录/测量(例如，在凌晨1点、4点到22点)，我将第一个数据帧中的开始时间转换/削减为8个框，以便为每个记录组合相应的天气条件。我如何将这两个框架组合在一起，以便每个租金都具有相应的天气条件？假设我有字段df1.rent_id、df1.rent_day、df1.starting hour(从1到8)和df2.day、df2.hr(从1到8)、df2.temp等等如何组合/连接这两个数据帧以获得我想要的

浏览 2提问于2019-06-16得票数 0

1回答

如何保留所有键列并连接Pandas数据帧？

python-3.x、pandas、dataframe、join

我需要连接两个数据帧，使用的键与我在执行连接时创建的几个临时数据帧的键相同。下面的代码运行得很好，但我想知道当使用subj作为键连接下面的两个熊猫数据帧时，是否有办法同时保留像subj_x和subj_y这样的连接键列。谢谢 head = [['nationality', 'BART', 'USA']] body = [['placeOfBirth', 'BART', 'NEWYORK'], ['hasFather', 'BART', 'HOMMER']

浏览 0提问于2021-05-08得票数 0

1回答

python、pandas、dataframe

我有3个格式和列相同的数据帧，每个数据帧都有一个列标准1。每个数据帧都由不同的人填充，我希望将该列的非NaN值合并到3个数据帧中，然后将其存储在excel文件中，使NaN在excel中为空白值。我如何在Python中做到这一点？另外，我想知道是否有至少两个人来填补的问题？ DataFrame 1 ID Criterion 1 1021 10 1022 NaN 1023 NaN 1024 NaN 1025 NaN DataFrame 2 ID Criterion 1 1021 NaN 1022 15 1023

浏览 6提问于2020-03-12得票数 0

3回答

“融合”两个数据帧的最佳方式是什么？

我有两个数据框(df_a和df_b)，它们都包含许多列和患者ID。这些列包含有关特定诊断(TRUE或FALSE)的信息。我的任务是组合这两个数据帧，以便如果其中任何一个数据帧中的值为TRUE，则该值为TRUE。实际上，df_a和df_b中的行数是不同的。匹配应该使用id来完成。两个数据帧具有相同的一组列。 df_a <- data.frame(id = 1:10, dg_a = c(T, T, T, F, F, F, T, T, F, T), dg_b = c(F, F, F, F, T, T, F, T, T, F

浏览 2提问于2018-02-12得票数 1

回答已采纳

1回答

如何同时对两个DataFrame排序

python-3.x、pandas

我有一个dataframe存储了数字数据，另一个dataframe是类别。但是，我想同时对两个数据帧进行排序。 df_A中的每个条目都可以映射到df_B，因为df_A存储数字数据，而df_B存储它的类别。因此，最终，我想重建一个新的数据帧，使其具有一个数据帧来按每个类别存储数字数据。我能想到的是同时对df_A和df_B进行排序，然后重命名df_A的索引。 >>print (df_A) 26 27 28 33 3 0.9 1.0 0.4 0.0 4 1.0 0.8 1.0 0.4 5 0.9 1.0 1.0 0.9 >>pr

浏览 28提问于2019-09-03得票数 1

回答已采纳

2回答

我有以下两个数据帧： Names<-c("Max","Helen","Bob","Eva") Id<-c(1,2,3,4) LISTN<-data.frame(Names,Id) Name1<-c("Max","Bob") Name2<-c("Helen","Eva") PAIRS<-data.frame(Name1,Name2) 我想将PAIRS的列Name1和Name2的值替换为在LISTN中找到的相应Id。结果应该如下所示

浏览 13提问于2019-01-16得票数 1

回答已采纳

1回答

基于不同变量的两个数据帧合并的基本问题

r、dataframe

我有两个不同的data.frames与diff。尺寸。 dim(df1) = 2942 obs. 6 var. dim(df2)= 16533 obs. 2307 var. 我想合并df1和df2的目标是一个df3 with 2942 observations。以下变量定义数据帧中的观测值：serial (group indetification number), id1 (person identifier from the group ranges from 1 to number of people in the group), Day (the week day when t

浏览 16提问于2020-04-14得票数 0

回答已采纳

1回答

正确地将一个dataframe列的值映射到其他列dataframe。

python、pandas

我有两个数据帧，其中一个列是常见的。我想比较这两个数据帧，并将数据帧2中第二列的值映射到第一列(如果匹配的话)。例如，我有一个数据框架，比如treasury_shares和entity_Id列，另一个数据框架是soiValues，列是entityId和attribute_value。我希望比较entity_Id，并在数据帧A中创建一个新列，并将attribute_value值正确地分配给数据帧treasury_shares中的entity_Id，就像它们在数据帧soiValues中一样。目前，我所做的是treasury_shares.insert(6, "SOI priority&#

浏览 1提问于2022-08-15得票数 0

3回答

Pandas数据帧垂直合并

python、pandas

我有一个关于合并两个数据帧的查询，例如，我有两个数据帧，如下所示： print(df1) Year Location 0 2013 america 1 2008 usa 2 2011 asia print(df2) Year Location 0 2008 usa 1 2008 usa 2 2009 asia 我的预期输出： Year Location 2013 america 2008 usa

浏览 0提问于2019-04-11得票数 2

1回答

连接具有不同行数和列数的两个数据帧

python、pandas、dataframe

我有两个数据帧： df1 shape = (101, 4825) df2 shape = (97, 5818) df2的前4825个列名与df1相同，然后递增+1。但是，在这两个数据帧的末尾，都有一个名为Group_number的列。我希望连接两个数据帧，以便最终数据帧的形状为(198,5818)，即最终数据帧包含df1部分的和NaN值的所有行(在初始的4825值之后)。我尝试使用pd.concat([df1,df2])，但是Group_number列搞混了。

浏览 1提问于2018-08-08得票数 0

2回答

如何从Pandas dataframe中删除行，如果相同的行存在于另一个dataframe中，但以来自两个df的所有列结束

python、pandas

我有两个不同的Pandas数据帧，它们有一个共同的列。我在Stack overflow上看到过类似的问题，但似乎没有一个问题以两个数据帧中的列结尾，所以请在标记为重复之前阅读下面的内容。示例：数据帧1 ID col1 col2 ... 1 9 5 2 8 4 3 7 3 4 6 2 数据帧2 ID col3 col4 ... 3 11 15 4 12 16 7 13 17 我想要实现的是一个数据帧，其中包含来自两个数据帧的列，但没有在dataframe2中找到的ID。即：期望的结果：

浏览 17提问于2019-01-16得票数 5

回答已采纳