合并列值匹配的两个数据帧_合并列值上的两个数据帧_合并列值不同的不同数据帧 - 腾讯云开发者社区

、

我在熊猫里有两个数据帧。现在，我想将它们合并到一个数据帧中，在该数据帧中，每个额外的列对应于与dataframe2中的键对应的元素列表。一个表类似于另一个表的子表(第二个表有一个外键，它引用table1的主键)。例如, 我不知道任何内置的方法来做这样的operation.So，如果你能帮助我合并列，那就太好了。提前谢谢。

浏览 5提问于2020-10-21得票数 0

1回答

在R中合并会产生比其中一个数据框更多的行

、、、

我有两个数据帧，第一个包含9994行，第二个包含60431行。我想合并两个数据帧，以便合并后的数据帧包含两个数据帧的组合列，但只包含9994行。然而，我在合并时得到了超过9994行。我如何确保这种情况不会发生？ df1 = readRDS('data1.RDS') nrow(df1) # [1] 9994 df2 = readRDS('data2.RDS') nrow(df2) # [1] 60431 df = merge(df1,df2,by=c("col1","col2")) nrow(df) # [1] 10057

浏览 2提问于2015-05-23得票数 7

1回答

pandas合并2个数据帧并在合并数据中添加新列

、

你能帮我解决这个问题吗?我不能在python pandas中走动，基本上我有两个数据帧，如下: df1 df2 我从上面的两个数据帧创建了一个连接的数据帧，并得到了这个结果: df3=pd.concat(df1，df2，sort=False) 现在我在上面的df3中有两列，即"a“和"az”，我想合并它们，因为它们是相同的，但在第二个dataframe中没有数据的地方有零。那么，有没有一种方法可以让这两个列的合并列表示相同的数字，即在列"a“中有零的地方，它应该将其填充为列"az”中的值，反之亦然。如果你能帮上忙，我将不胜感激。谢谢。

浏览 7提问于2020-06-06得票数 0

1回答

如何使用tabula将PDF表格提取到dataframe中

我正在尝试提取PDF文件的“内容”页面(例如，第2页)作为一个表，并提出一个数据帧来跟踪项目与其对应的起始页码。一些人建议使用"Tabula“。我尝试了几行，但似乎要么找不到read_pdf模块，要么得到一个空的数据帧。感谢任何帮助，让它工作？ from tabula import wrapper myfile='‘ df = wrapper.read_pdf(myfile)

浏览 0提问于2017-11-18得票数 0

1回答

合并两个h2o框架引发异常:列必须是相同的类型

、

我有两个h2o帧。这两个h2o框架都有公共的site_id和时间戳列。我需要通过应用左联接来合并这些帧。site_id列为int类型，而时间戳为时间类型。我确认，当我运行describe()命令时。 df = h2o.H2OFrame.merge(df1, df2, by_x = ["site_id", "timestamp"], by_y=["site_id", "timestamp"]) df.head() 这将返回以下错误。 H2OResponseError:服务器错误java.lang.IllegalArgumentEx

浏览 3提问于2019-10-21得票数 0

2回答

Pandas将数据框列中的列表与另一个数据框合并

、、

我有两个数据帧： ID LIST_VALUES 1 [a,b,c] 2 [a,n,t] 3 [x] 4 [h,h] VALUE MAPPING a alpha b bravo c charlie n november h hotel t tango x xray 我需要向第一个数据帧添加一个新列，该列根据LIST_VALUES列表中的内容显示第二个数据帧中的值。如果某个值在LIST_VALUES中重复，则只在输出

浏览 26提问于2020-03-19得票数 0

1回答

如何匹配ID号以合并两个数据帧

、

我有两个数据帧，这两个数据帧的列的ID号应该匹配。然而，这两个数据帧的ID数量不同。一个有118个ID，另一个有103个ID。具有118个ID的数据帧有全部103个ID，但有一些额外的ID。我想从118行数据帧中提取两列，并根据ID号将它们与103行数据帧中匹配的ID合并。我不知道解决这个问题的最简单的方法。

浏览 2提问于2019-02-07得票数 3

回答已采纳

1回答

如何重新建立索引以合并两个数据帧？

、

我正在尝试合并两个都有'product_desc‘列的数据帧。我使用的是Pandas 0.13和Python 2.7。 small_df = pd.merge(small_df, linregress_df, on = 'product_desc', how = 'left') 但是，我得到以下错误： pandas.core.index.InvalidIndexError: Reindexing only valid with uniquely valued Index objects 我将两个数据帧导出到平面文件中，其中的索引或其他列都没有重复值。我需

浏览 8提问于2014-06-09得票数 2

3回答

通过行进ID将行匹配到子集

、

我有两个数据帧 df1 = data.frame( Id=c(1, 2, 3), address = c(3130, 5234, 1400)) df2 = data.frame(Id=c(1,1,2, 3, 3), address = c(5300, 3130, 5430, 5500, 2410)) 我尝试将df1中的每个地址与df2中具有匹配Id的每个地址进行匹配，如果匹配，则返回True，如果不匹配，则返回False。因此结果将是TRUE, FALSE, FALSE

浏览 4提问于2018-12-01得票数 0

5回答

多个熊猫数据帧中列值的频率

、、

我有多个熊猫数据帧(超过70个)，每个都有相同的列。假设每个数据帧中只有10行。我希望在每个数据帧中找到列A‘值，并列出它。示例： # Import pandas library import pandas as pd # initialize list of lists data = [['tom', 10], ['nick', 15], ['juli', 14]] # Create the pandas DataFrame df = pd.DataFrame(data, columns = ['Name'

浏览 11提问于2020-09-06得票数 0

回答已采纳

2回答

在R中合并数据帧

、、、

我有一个包含财务数据的大型数据框架，如下所示： id Tradedate name hour open close 19897 2013-01-30 instrument1 1 18.01 13.50 19898 2013-01-30 instrument2 2 15.72 8.99 19899 2013-01-30 instrument3 3 12.80 11.42 19900 2013-01-30 instrument4 4 12.71 12.85 在上面的数据框中有数

浏览 0提问于2013-07-11得票数 0

回答已采纳

1回答

与CSV文件连接的Pandas DF

、、、

我想将两个数据帧连接到一个df中，并将其保存为一个csv，因为第一个数据帧位于csv文件中，所以我不想在内存中加载它。我尝试了附加模式下的df.to_csv，但是对于不同的列(比较和合并列)，它的行为并不像df.concat。有人知道如何连接csv和df吗？基本上，csv和df可以有不同的列，因此输出csv应该只有一个标头以及所有列和适当的相应行。

浏览 6提问于2022-02-17得票数 0

1回答

查找两个数据帧之间不匹配的行

、、

我有一个场景，我希望在两个数据帧之间找到不匹配的行。这两个数据帧都有大约30列和一个唯一标识每条记录/行的id列。因此，我想检查df1中的行是否与df2中的行不同。df1是更新后的数据帧，df2是以前的版本。我尝试了一种方法pd.concat([df1, df2]).drop_duplicates(keep=False)，但它只是将两个数据帧结合在一起。有办法做到这一点吗。如果能帮上忙我会很感激的。这两个dfs的示例数据如下所示。 id user_id type status 总共有39列，其中可能包含NULL值。谢谢。 P.S. df2将始终是df1的子集。

浏览 11提问于2020-09-28得票数 1

3回答

在R结果数据帧中合并数据帧太大

、、、

我正在尝试合并R中的两个数据帧，通过它们共享的一列来连接它们。下面是两个数据帧的屏幕截图，我在"INC_KEY“列上合并。这是我用来合并两个数据帧的代码: dp <- inner_join(d，p，by="INC_KEY") D有177156个观测值，p有1641137个观测值，但最终合并的数据帧有8416113个观测值，这对我来说没有意义。我还尝试将上面的inner_join函数更改为merge函数，但仍然得到相同的结果。我想知道如何修复这段代码，以便合并后的数据帧具有真实的观察值--非常感谢您的帮助！

浏览 0提问于2021-01-11得票数 0

1回答

如何合并修改Dataframe上的数据的列

、、

社区！我有这个数据帧：我想合并列并组织数据，使其看起来像这样：

浏览 2提问于2021-07-29得票数 0

2回答

R中数据帧中值的唯一和非唯一列表

、

假设我有两个数据帧：数据帧1(让我们称之为Data1)： V1 V2 1 "AB" 3 "XY" 5 "DH" 8 "ST" 7 "RE" Data1代码： V1 <- c(1,3,5,8,7) V2 <- c("AB","XY", "DH", "ST","RE") Data1 <- data.frame(V1,V2) 数据帧2(让我们称之为Data2

浏览 3提问于2013-07-12得票数 1

回答已采纳

1回答

基于另一个数据帧执行替换

、、

我有两个数据帧： item | label 213 'red' 112 'green' 332 'orange' ... 另一个数据帧本质上就像一个字典： old_label | new_label 'red' 'red and bright' 'orange' 'mild orange' 如何将映射从第二个数据帧应用到第一个数据帧，以获得： item | label 213 'red

浏览 6提问于2019-11-13得票数 1

回答已采纳

2回答

如何在不获取额外行的情况下合并两个数据帧？

、

基本上，我有两个数据帧，第一个看起来像这样： ? 第二个是这样的： ? 我想要获取第二个数据帧的"lat“和"lnt”列，并仅当两个数据帧中的城市名称匹配时才添加到第一个数据帧中。我尝试使用pd.merge()，但它创建了具有重复值的新行。如果可能，我希望在没有任何匹配的行中放置一个NaN，但我不想删除或添加行到原始数据帧。

浏览 19提问于2021-08-12得票数 0

回答已采纳

1回答

如何获取带有GAE投影的查询中重复属性的所有值

、

我有一个ndb模型，它有一个列出多个值的ComputedProperty。 sku_name = ndb.ComputedProperty(lambda self: makekeys(self.sku, self.name), indexed=True, repeated=True) makekeys创建了两个参数的列表，所以没有什么特别的。做以下工作： query = cls.query() data = query.fetch(projection=[Pricelist.sku_name]) for d in data: logging.info(d.sku_name) 只获取d

浏览 1提问于2017-06-30得票数 1

回答已采纳

2回答

在不同数据报中的列中查找一列的值

、

我有两个数据帧，一个是大约450万行，另一个是1200行。我希望在较大数据帧的列中找到较小数据帧的值，并根据true/false最终删除这些记录。 df1 ={‘id’：‘1234’，‘4566’，‘6789’，‘Name’：‘Sara’，‘Iris’，‘Jeff’，‘Age’：10，12，47} df2 ={‘id’：‘1234’，‘4566’，‘1080’} 我写的函数： def find_match(row): if (row.column in df1.column.values) == (row.column in df2.column.values): retur

浏览 3提问于2022-09-18得票数 0

1回答

从R到Python的过渡:我的关卡到哪里去了？

、

如果我有一个这样的数据帧 df = pd.DataFrame({'labels': ['A', 'B', 'C'], 'moreLabels': ['D','E','F'], 'numbers': [1,2,3] }) 我想找出'moreLabels‘的所有可能值，有没有简单的方法？我旋转并列出了透视表的列，如下所示： pivot = df.pivot_table(values = 'numbers', index =

浏览 2提问于2018-02-04得票数 1

回答已采纳

1回答

熊猫:使用一列的值，根据两列计算表中的行

我目前有以下数据： SN Gender Purchase Name 1 Female 1.14 Name 2 Female 2.50 Name 3 Male 7.77 Name 1 Female 2.74 Name 3 Male 4.58 Name 3 Male 9.99 Name 1 Female 5.55 Name 2 Female 1.20 我想弄清楚怎样才能从这样的桌子上

浏览 5提问于2020-10-30得票数 0

回答已采纳

2回答

使用R对相似单词进行聚类

、、、

我正在使用R，我有两个数据帧。其中一个包含200000个单词，如“猫”、“猫”、"cts“、”狗“和”狗“，另一个包含”猫“和”狗“等单词。我想对第一个数据帧进行聚类，并将所有相似的单词替换为适合第二个数据帧的单词。例如，将"cat“和"cts”改为“cat”。

浏览 0提问于2019-01-13得票数 0

2回答

rbind数据帧，重复行名问题

、、、、

虽然在matrix中允许重复的行(和列)名称，但在data.frame中不允许。尝试rbind()一些具有共同行名的数据帧会突出这个问题。考虑下面的两个数据帧： foo = data.frame(a=1:3, b=5:7) rownames(foo)=c("w","x","y") bar = data.frame(a=c(2,4), b=c(6,8)) rownames(bar)=c("x","z") # foo bar # a b a b # w 1 5

浏览 0提问于2012-10-24得票数 4

回答已采纳

2回答

如何使用模糊逻辑从熊猫的数据帧中匹配和提取文本？

、

我有两个数据帧，如下: DF1： Name Value buying fish hook 240 arrange lunch 75 repair equipment 800 purchase air condition 1400 buying fish 66 DF 2： Name fish lunch equipemt air condition hair condition fish hook 我想用模糊逻辑匹配来自两个数据帧的名称列中的名称，并将第二个数据帧中的名称列

浏览 1提问于2018-07-05得票数 3

1回答

在python中基于部分字符串匹配连接到数据帧

、、、

我有两个数据帧，有一个共同的关键产品名称，我想做的是通过连接前两个数据帧来创建第三个数据帧，这两个数据帧基于80-90%的相似度的部分字符串匹配，数据集相当大，我已经尝试使用scikit-learn的tfidf，但我一直丢失我的参考索引。在下面的例子中:迷你无线蓝牙运动立体声耳机和OnePlus 6砂岩保护套都需要在df3中，帮助将非常感谢。输出示例： import pandas as pd df1=pd.DataFrame({'Product_Name1': ['Mini Wireless Bluetooth Sports Stereo Headset',

浏览 12提问于2018-12-19得票数 0

2回答

如何在R中的数据帧匹配/比较中包含一个误差级别

、、、、

我对R是新手，我正在尽我最大的努力(到目前为止，还很好)，但是我遇到了一个问题。我有两个数据帧，一个有理论值，另一个有实验值，数据帧不是相同的长度。我想比较这两个数据帧，以找到它们之间的匹配值。由于它是理论值和实验值，我需要在匹配值时包含一个误差级别，比如从理论值中的±0.5。这就是我遇到问题的地方--我不知道如何包含这个错误。数据帧很安静，很大，但下面是我尝试过的一个例子。 Theory <- c("195.0882", "196.0852", "196.0916",

浏览 2提问于2016-08-01得票数 1

回答已采纳

1回答

如何将这些MongoDB数据导出到CSV文件(两个集合的“连接”)？

、

我有一个有两个集合的数据库。集合cars有如下所示的文档： { license_number: "123456", name: "tesla" } { license_number: "654321", name: "ford" } { license_number: "987654", name: "volvo" } 集合greatCars有如下所示的文档： { license_number: "123456" } 我希望将这两个集合的“联接”导出到如下所示的CSV文件中： li

浏览 3提问于2016-11-12得票数 2

回答已采纳

1回答

Python Pandas:将一列合并到另一个数据框不会返回相同数量的行

、、

我有两个数据帧:第一个数据帧(假设df1)有389行5列，第二个数据帧(假设df2)有10025行10列。我想将其中一列(假设列名为'description')合并到第一个数据框中。我使用pd.merge()命令来合并列，如下所示： pd.merge(df1,df2[['ID','description']],on='ID',how='left') 但是，上面的命令返回22338行。当我在stackoverflow上搜索时，我发现有一个线程请求将drop_duplicates与第二个数据帧一起使用。因此，我更改了

浏览 12提问于2020-06-05得票数 0

回答已采纳

1回答

用于在同一日期存在公共标识符时合计行的Python脚本

、

我有一个大型数据集，其中包含跨不同月份的多个列。我使用了两个标识符，分别是许可证和位置。这是我的数据的一个示例：https://i.stack.imgur.com/aU8JU.png 我正在迁移我的数据，我的一个工作表需要除"Type“列之外的所有列。但是，当我迁移时，我会有重复的行，因为有重复的许可证和位置。我想每月总结一下这些重复的许可证和位置。这是我想要的输出： https://i.stack.imgur.com/WwIz2.png 到目前为止我的迁移代码是： def migrate(df, template): inventory = df.copy() in

浏览 13提问于2021-08-25得票数 0

2回答

如何将数据帧列设置为R中的可提取模式？

、、

我正在尝试以下操作：*从df中的合并列中提取字符模式*使用提取的模式创建df列*从合并列中删除提取的模式假设您有以下示例数据框 Col1 <- c("a1 b1 c1","a2 b2 c2","a3 b3 c3","a4 b4 c4") dat <- data.frame(Col1) dat Col1 1 a1 b1 c1 2 a2 b2 c2 3 a3 b3 c3 4 a4 b4 c4 如何将包含"a“的所有元素提取到另一列中，然后从Col1中删除该元素以获取：

浏览 3提问于2016-09-19得票数 0

1回答

如何从2个数据帧中创建多个变量的散点图？

、、

我有一个数据帧df1，如下所示： Observed PeakFlow (cfs) Modelled Peak Flow (cfs) 9.78768 10.93963 1.999368 2.037152 11.63652 8.541796 3.237471 3.970588 54.04929 22.94427 4.68

浏览 0提问于2017-02-22得票数 2

回答已采纳

1回答

python熊猫-在将键与另一个数据帧匹配后创建一个列

、、、

我有两个数据帧。为了简单起见，我将在这里提供两个虚拟数据帧。 A = pd.DataFrame({'id':[1,2,3], 'name':['a','b','c']}) B = pd.DataFrame({'id':[1,1,1,3,2,3,1]}) 现在，我想在数据帧B上创建一个列，其名称与ids匹配。在这种情况下，我的期望输出将是： B = pd.DataFrame({'id':[1,1,1,3,2,3,1], 'name':['a','

浏览 2提问于2020-01-25得票数 0

回答已采纳

1回答

如何合并pyspark dataframe和丢弃null值？

、、

浏览 4提问于2020-12-04得票数 0

回答已采纳

1回答

如何合并R中列名相同但键值不同的两个数据框

、、

浏览 4提问于2019-02-28得票数 1

1回答

如何将第一个dataframe中的列与第二个dataframe中的列进行比较，匹配后从第二个dataframe中的另一个列中提取值

、、

假设我有一个数据帧： a = [['A','def'],['A','xyz'],['A','uiu'], ['B','jkl'], ['C','pqr'], ['C','rty']] df1 = pd.DataFrame(a, columns=['1', '2']) 1 2 0 A def 1 A xyz 2 A uiu 3 B

浏览 8提问于2021-03-10得票数 1

回答已采纳

2回答

熊猫在创建中与合并栏连接()

、、

我正在尝试创建一个非常大的dataframe，它由许多较小的dataframe (重命名为dataframe名称)组成的一列组成。我使用CONCAT()和循环遍历表示dataframes的字典值，并在索引值上循环创建大型dataframe。CONCAT() join_axes是所有数据格式的公共索引。这很好，但是我有重复的列名。我必须能够在指定的窗口上循环索引，这是我最后创建数据帧的一部分--因此，删除这个步骤不是一个选项。例如，这将产生以下具有重复列的最终数据帧：除了合并列以产生类似于这样的输出外，还有什么方法可以非常灵活地使用CONCAT()吗？

浏览 9提问于2016-11-03得票数 0

回答已采纳

1回答

如何连接两个不同的数据帧并将列中的值替换为另一列中的值？

、、

浏览 16提问于2021-07-02得票数 0

2回答

用多列划分两个数据帧(特定于列)

、、

我有两个大小相同的数据帧(df1和df2)。我想用df1 column1 / df2 column1的值创建一个新的数据帧。所以本质上df3 = df1(c1)/df2(c1)，df1(c2)/df2(c2)，df1(c3)/df2(c3)... 我已经尝试了下面的代码，但是这两个代码都给出了一个充满NaN的数据帧 #attempt 1 df3 = df2.divide(df1, axis='columns') #attempt 2 df3= df2/df1

浏览 3提问于2019-10-09得票数 0

1回答

梳理数据集并对齐两个独立的时间序列

我正在将两个古气候学数据集合并为一个用于回归模型。每个数据集都有一个从0到802kys的整数值。然而，其中一个集合在600 sets ()之后跳过一年。当我将所有数据放入一帧时，丢失时间的时间序列较短，与另一帧不一致，并重新启动。我想要的是让不完整的时间序列具有安娜的值，这样我就可以省略这些行。即当为v2=601 (见图像)时，我希望相应的列读取NA，601，3.97 我的组合代码是： df_new <- cbind(Df1$Age, Df2$Age, Df1$Benthic, Df2$

浏览 2提问于2020-09-01得票数 0

1回答

从具有相同索引和列的两个pandas数据帧执行计算的最快方法

、、

我有两个pandas数据帧，每个都有相同的索引和列。我想创建第三个pandas数据帧，其中包含其他两个细胞的乘积。这是我目前的解决方案，但它太慢了。 import pandas as pd new_df = pd.DataFrame(columns=df1.columns, index=df1.index, data=[]) for col, values in new_df.iteritems(): for idx, value in values.iteritems(): foo = df1.loc[idx][col] bar = df2.l

浏览 10提问于2019-05-11得票数 1

回答已采纳

2回答

动态合并数据帧

、、

我有两个数据帧: df1和df2。我想在df2中合并列链接上的2个数据帧。df2中的链接列包含与df1中匹配的列和值的列表： df1 = pd.DataFrame({'p':[1,2,3,4], 'a':[1,2,2,2],'b':['z','z','z','z'],'c':[3,3,4,4],'d':[5,5,5,6]}) df2 = pd.DataFrame({'e':[11,22,33,44], 'link'

浏览 14提问于2021-05-08得票数 2

1回答

检查是否在同一位置的第二个dataframe (即使作为子串)字符串中存在一个dataframe字符串

、

我尝试在两个不同的数据帧中计数，第一个数据帧中有多少个字符串包含在第二个数据帧中。示例： import numpy as np import pandas as pd df_1 = pd.DataFrame([["hello, world", "hello, world"]] * 3, columns=['A', 'B']) df_2 = pd.DataFrame([["hello", "hello"]] * 3, columns=['A', 'B']) 如果我选

浏览 14提问于2020-12-17得票数 1

回答已采纳

1回答

查找两个帧之间的变换

、、

我有两个来自视频提要的连续帧，我使用快速算法检测这两个关键点。我使用平方差和法(SSD)匹配关键点。所以基本上我已经在两个帧之间匹配了关键点。现在我想从一组匹配的关键点计算两帧之间的仿射变换(缩放+旋转+平移)。我知道如何从一对两点计算仿射变换。我的问题是，我们如何计算超过两三个点？我知道我必须使用最小中值平方法，但我对这个领域还不熟悉，所以我不知道如何使用它。有没有人可以详细解释一下，或者提供一个简单的链接？

浏览 0提问于2014-08-12得票数 2

2回答

在Pandas Python中梳理两个数据帧

、

我想合并两个数据帧我想将这两个数据帧合并在一起，这样帐户就是一样的。例如，acct 10应该在CME和NISSAN中取值，而其余的都是零。

浏览 0提问于2019-02-19得票数 1

1回答

需要比较pandas中两个数据帧中的两列

、、

我需要比较两个数据帧之间的第一列值，并通过将该值与第二个数据帧的第二列相乘来更改第二列的值 dataframe1 Money Currency 34 USD 31 EUR 20 JPY dataframe2 Curr Value EUR 1.21 JPY 0.78 我的预期输出 Money Currency 34 USD 37.51(31*1.21) USD 15.6(20*0.78) USD 提前感谢

浏览 3提问于2021-05-10得票数 0

1回答

如何使用R实现基于另一列中没有出现在每个观察中的字符串的组的grep？

、、、

必须简化之前一个失败的问题。我希望提取由'id‘标识的整个组，其中包含另一列中的字符串('inter’或'high')，名为“strmatch”。这个字符串并不会出现在这个组的每个观察中，但是如果它发生了，我希望将这个组分配给相应的数据帧。数据帧 df <- data.frame(id = c("a", "a", "b", "b","c", "c","d","d"), std = c("

浏览 2提问于2019-08-20得票数 0

回答已采纳

4回答

R:基于匹配表的和列，合并列名

我有这样一个数据框架(字母是列名)： a b c B C A 1 2 3 6 7 8 1 2 3 6 7 8 1 2 3 6 7 8 1 2 3 6 7 8 我想根据这个匹配表对列进行求和： a A b B c C 同时合并列名，以便结果是： a/A b/B c/C 9 8 10 9 8 10 9 8 10 9 8 10 请记住，解决方案需要适用于大数据帧，因此我不能手动指定新的列名。非常感谢!

浏览 3提问于2017-03-30得票数 0

回答已采纳

2回答

Panda对具有重复项的customerEmail列的合并

、、、

目的是从这个数据集中检测欺诈。我有两个数据帧，列如下： DF1customerEmail、客户电话、客户设备、客户添加、NoOftransactions、欺诈等(168,11) DF2customerEmail、交易etc、支付方式、订单状态等(623,11) customerEmail列在两个数据帧中都是通用的，因此合并customerEmail上的表是有意义的。问题是我在DF2中重复了customerEmail，而在DF1中没有引用。因此，当我使用以下命令合并时：：DF3 = pd.merge(DF1，DF2，on='customerEmail') 行和列的总大小为(

浏览 0提问于2020-08-27得票数 0

2回答

基于多个非唯一列的合并替换

、、、

我有两个数据帧。第一个包含图像的原始状态，包含所有可以从头开始重建图像的数据(整个坐标集及其颜色值)。然后我有了第二个数据帧。这个更小，只包含有关更新状态和原始状态之间的差异(所做的更改)的数据。有点像关键帧的视频编码。不幸的是，我没有一个独特的id列来帮助我匹配它们。我有一个x列，我有一个y列，结合起来，可以构成一个唯一的id。我的问题是:合并这两个数据集的优雅方法是什么，将原始数据帧中的值替换为x和y坐标匹配的“差分”数据帧中的值。下面是一些示例数据来说明： original <- data.frame(x = 1:10, y = 23:32, value = 120:129

浏览 3提问于2017-04-04得票数 3

回答已采纳